微信读书书城
片上网络原理与设计
加入书架
首页
我的书架
登录
片上网络原理与设计
马胜 黄立波 赖明澈 石伟 王鹏 王志英
微信读书推荐值
待评分
推荐
一般
不行
推荐
一般
不行
推荐(0)
一般(0)
不行(0)
电子书
会员卡可读
字数
30.4
万字
简介
本书采用自底向上的方式深入探索了片上网络的设计空间,从底层路由器、缓冲结构和网络拓扑的逻辑实现,到网络层路由算法和流控机制的研究,到上层编程模式和片上网络的协同设计。
close
简介
本书采用自底向上的方式深入探索了片上网络的设计空间,从底层路由器、缓冲结构和网络拓扑的逻辑实现,到网络层路由算法和流控机制的研究,到上层编程模式和片上网络的协同设计。
版权
出版社
机械工业出版社
出版时间
2017年1月
字数
304,223
分类
计算机-计算机综合
试读结束
本书为付费会员卡可读
登录后获得专属福利 · 百万好书免费读
上一页
下一页
热门想法
复制
划线
写想法
AI问书
书友想法
写想法
问书
Generated by AI
写想法
字号大小
字体
片上网络原理与设计
马胜 黄立波 赖明澈 石伟 王鹏 王志英
扉页
版权信息
+
书签
前言
第一部分 序言
第1章 绪论
1.1 众核处理器时代
1.2 以通信为核心的跨层次优化
1.3 片上网络简介
1.3.1 拓扑结构
1.3.2 路由算法
1.3.3 流控机制
1.3.4 路由器微结构
1.3.5 性能评价指标
1.4 片上网络研究现状
1.4.1 拓扑结构的研究
1.4.2 单播通信路由的研究
1.4.3 聚合通信路由的研究
1.4.4 流控机制的研究
1.4.5 路由器微结构的研究
1.5 真实处理器的片上网络
1.5.1 MIT RAW处理器
1.5.2 Tilera TILE64处理器
1.5.3 Sony/Toshiba/IBM Cell处理器
1.5.4 U. T. Austion TRIPS处理器
1.5.5 Intel Teraflops处理器
1.5.6 Intel SCC处理器
1.5.7 Intel Larrabee处理器
1.5.8 Intel Knights Corner处理器
1.5.9 真实处理器片上网络特性总结
1.6 全书内容概述
1.7 参考文献
第二部分 逻辑层实现
第2章 单周期翼通道路由器结构
2.1 引言
2.2 翼通道路由器体系结构
2.2.1 翼通道单周期路由器总体结构
2.2.2 翼通道工作原理
2.3 路由器微体系结构设计
2.3.1 通道分配部件
2.3.2 快速仲裁部件
2.3.3 SIG管理单元和SIG控制单元
2.4 实验评估
2.4.1 模拟环境
2.4.2 流水线延迟分析
2.4.3 延迟与吞吐率
2.4.4 面积与功耗
2.5 本章小结
2.6 参考文献
第3章 动态虚通道路由器
3.1 引言
3.2 拥塞感知的动态虚通道结构
3.2.1 动态虚通道
3.2.2 拥塞缓解策略
3.3 拥塞感知的多端口共享缓冲结构
3.3.1 多端口共享缓冲的动态虚通道
3.3.2 拥塞缓解策略
3.4 DVC路由器微结构
3.4.1 虚通道控制部件
3.4.2 拥塞缓解电路
3.4.3 虚通道仲裁部件与开关仲裁部件
3.5 HiBB路由器微结构
3.5.1 虚通道控制部件
3.5.2 虚通道仲裁部件与输出端口仲裁部件
3.5.3 虚通道调整结构
3.6 实验评估
3.6.1 DVC路由器评估
3.6.2 HiBB路由器评估
3.7 本章小结
3.8 参考文献
第4章 虚拟总线拓扑结构
4.1 引言
4.2 相关研究
4.3 研究动机
4.3.1 基本片上通信网络
4.3.2 片上网络问题分析
4.3.3 基于事务的总线通信优势
4.4 虚拟总线片上网络
4.4.1 拓扑结构
4.4.2 虚拟总线机制
4.4.3 饿死与死锁避免
4.4.4 VBON路由器结构
4.5 实验评估
4.5.1 模拟框架
4.5.2 合成流量评估
4.5.3 真实应用评估
4.5.4 功耗分析
4.5.5 开销分析
4.6 本章小结
4.7 参考文献
第三部分 网络层路由和流控设计
第5章 区域隔离路由算法
5.1 引言
5.2 相关研究
5.3 研究动机
5.3.1 局部自适应算法的局限性
5.3.2 应用程序内部的干扰
5.3.3 应用程序之间的干扰
5.4 区域隔离路由算法
5.4.1 拥塞信息传播网络
5.4.2 DBAR路由器微结构
5.4.3 路由函数设计
5.5 实验评估
5.5.1 路由函数评估
5.5.2 单区域性能
5.5.3 多区域性能
5.5.4 集中型网格网络性能
5.6 硬件开销讨论
5.6.1 连线资源
5.6.2 路由器开销
5.6.3 功耗和能量延迟积
5.7 进一步讨论
5.7.1 拥塞信息传播网络带宽
5.7.2 DBAR的可扩展性
5.7.3 拥塞信息传播延迟
5.8 本章小结
5.9 参考文献
第6章 完全自适应路由算法的流控机制
6.1 引言
6.2 相关研究
6.2.1 死锁避免理论
6.2.2 完全自适应路由算法设计
6.3 研究动机
6.3.1 虚通道分配策略
6.3.2 路由灵活性
6.4 流控和路由设计
6.4.1 全报文发送
6.4.2 逃逸虚通道的积极分配策略
6.4.3 完全自适应路由算法
6.4.4 路由器微结构
6.5 合成流量模式评测
6.5.1 合成流量模式结果
6.5.2 路由算法的缓存利用率
6.5.3 敏感性分析
6.6 真实应用程序评测
6.6.1 实验方法和实验配置
6.6.2 PARSEC测试集结果
6.7 流控机制的详细分析
6.7.1 缓存利用率的详细分析
6.7.2 流控机制的公平性分析
6.8 进一步讨论
6.8.1 报文长度和虚通道深度
6.8.2 DAMQ和混合流控机制
6.9 本章小结
6.10 参考文献
第7章 切片气泡流控机制
7.1 引言
7.2 传统设计的局限
7.2.1 dateline
7.2.2 本地气泡策略
7.2.3 关键气泡策略
7.2.4 处理变长报文的低效性
7.3 切片气泡流控机制及策略
7.3.1 理论描述
7.3.2 本地切片气泡策略
7.3.3 关键切片气泡策略
7.3.4 饿死现象
7.4 路由器流水线和微结构
7.4.1 FBFC路由器
7.4.2 VCT路由器
7.5 实验方法
7.6 一维Torus网络性能评测
7.6.1 性能
7.6.2 缓存利用率
7.6.3 短报文和长报文的传输延迟
7.7 二维Torus网络性能评测
7.7.1 4×4 Torus网络性能
7.7.2 单切片报文比例敏感性分析
7.7.3 缓存数量敏感性分析
7.7.4 8×8 Torus网络可扩展性分析
7.7.5 饿死现象分析
7.7.6 PARSEC测试集实验结果
7.7.7 大规模系统和消息传递编程模式
7.8 开销:功耗和面积
7.8.1 测试方法学
7.8.2 功耗
7.8.3 面积
7.8.4 与网格网络的比较
7.9 进一步讨论和相关工作
7.9.1 进一步讨论
7.9.2 相关工作
7.10 本章小结
7.11 参考文献
第8章 高效能与公平性流控
8.1 基于当值缓存高效能路由器设计
8.1.1 引言
8.1.2 高效能路由器
8.1.3 实验设计
8.1.4 实验评估
8.1.5 小结
8.2 基于报文剩余跳数的自适应流控
8.2.1 引言
8.2.2 报文之间的相互作用
8.2.3 公平性流控
8.2.4 实验评估
8.2.5 小结
8.3 参考文献
第四部分 软件层编程模式支持
第9章 一致性协议聚合通信支持
9.1 引言
9.2 归约消息组合框架
9.2.1 消息组合表格式
9.2.2 消息组合实例
9.2.3 消息组合表项的不足
9.3 均衡自适应多播路由算法
9.4 路由器流水线和微结构
9.5 实验评估
9.5.1 性能
9.5.2 BAM和RPM多播虚拟网络性能
9.5.3 消息组合表大小
9.5.4 敏感性分析
9.6 功耗和能量延迟积分析
9.7 相关研究
9.7.1 消息组合
9.7.2 片上网络多播路由算法
9.8 本章小结
9.9 参考文献
第10章 MPI原语的定制通信架构
10.1 引言
10.2 研究背景
10.3 研究动机
10.3.1 在NoC上实现MPI
10.3.2 MPI函数优化
10.4 定制通信架构
10.4.1 体系结构概述
10.4.2 定制的片上网络设计:VBON
10.4.3 MPI原语实现:MU
10.5 实验评估
10.5.1 方法
10.5.2 实验结果
10.6 本章小结
10.7 参考文献
第11章 MPI通信协议优化
11.1 引言
11.2 研究背景
11.2.1 MPI的通信协议
11.2.2 现存问题
11.2.3 相关工作
11.3 研究动机
11.4 自适应通信协议
11.4.1 目标与方法
11.4.2 基本MPI加速的片上网络设计
11.4.3 ADCM结构的支持
11.4.4 与理想协议的比较
11.5 实验评估
11.5.1 方法
11.5.2 合成流量结果
11.5.3 真实应用程序
11.5.4 敏感性分析
11.5.5 硬件开销
11.6 本章小结
11.7 参考文献
第五部分 后记
第12章 结语与展望
12.1 结语
12.2 展望
是否关闭自动购买?
关闭后,阅读到本书未购买章节均需要手动购买确认。
取消
关闭
片上网络原理与设计
已读到0% · 共0条笔记
你可以在这里记录本书的
想法、划线、书签
本地导入书籍的 AI 翻译功能
仅支持付费会员使用
微信扫码开通付费会员
一键翻译全文