UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高性能编程CUDA实战》首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA C的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA C的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA C中每个功能的适用场合,并编写出高性能的CUDA软件。
《GPU高性能编程CUDA实战》适合具备C或者C++知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计算的学生和教师的教辅。
译者序
序
前言
致谢
作者简介
第1章 为什么需要CUDA 1
1.1 本章目标 2
1.2 并行处理的历史 2
1.3 GPU计算的崛起 3
1.4 CUDA 5
1.5 CUDA的应用 6
1.6 本章小结 8
第2章 入门 9
2.1 本章目标 10
2.2 开发环境 10
2.3 本章小结 14
第3章 CUDA C简介 15
3.1 本章目标 16
3.2 第一个程序 16
3.3 查询设备 20
3.4 设备属性的使用 23
3.5 本章小结 24
第4章 CUDA C并行编程 26
4.1 本章目标 27
4.2 CUDA并行编程 27
4.3 本章小结 41
第5章 线程协作 42
5.1 本章目标 43
5.2 并行线程块的分解 43
5.3 共享内存和同步 54
5.4 本章小结 68
第6章 常量内存与事件 69
6.1 本章目标 70
6.2 常量内存 70
6.3 使用事件来测量性能 78
6.4 本章小结 83
第7章 纹理内存 84
7.1 本章目标 85
7.2 纹理内存简介 85
7.3 热传导模拟 86
7.4 本章小结 101
第8章 图形互操作性 102
8.1 本章目标 103
8.2 图形互操作 103
8.3 基于图形互操作性的GPU波纹示例 108
8.4 基于图形互操作性的热传导 113
8.5 DirectX互操作性 118
8.6 本章小结 118
第9章 原子性 119
9.1 本章目标 120
9.2 计算功能集 120
9.3 原子操作简介 122
9.4 计算直方图 124
9.5 本章小结 133
第10章 流 134
10.1 本章目标 135
10.2 页锁定主机内存 135
10.3 CUDA流 139
10.4 使用单个CUDA流 140
10.5 使用多个CUDA流 144
10.6 GPU的工作调度机制 149
10.7 高效地使用多个CUDA流 151
10.8 本章小结 152
第11章 多GPU系统上的CUDA C 154
11.1 本章目标 155
11.2 零拷贝主机内存 155
11.3 使用多个GPU 162
11.4 可移动的固定内存 166
11.5 本章小结 170
第12章 后记 171
12.1 本章目标 172
12.2 CUDA工具 172
12.3 参考资料 176
12.4 代码资源 178
12.5 本章小结 179
附录 高级原子操作 180
《中外民歌钢琴曲集 1》内容简介:从这套乐谱的功能来看,除了作为钢琴教材还可以作为多声写作和小品写作的例谱,配器课的习题集,
《西南联大文学社团研究(精)》内容简介:本书是中华书局2011年版《季节燃起的花朵——西南联大文学社团研究》一书的增订本,共约
《职业院校专业群课程体系构建研究》内容简介:本书由三部分组成。第一部分是导论,介绍了职业院校专业群建设以及专业群课程体系框
基于人工神经网络的机器翻译 本书特色 本论文研究的是机器翻译,而且探索摆脱基于符号系统的机器翻译和基于语料库统计的机器翻译模式,在机器翻译中应用人工神经网络的技...
codylindley是一名客户端工程师(也称为前端开发人员)及flash开发者。他在html、css、javascript、flash、客户端性能技术方面有
《上海的风花雪月》内容简介:鲜活流动着的上海的风花雪月,如何从历史的尘烟代入当下的情韵?那些被当作城市起居室的咖啡馆数十年
SandeepKumarPatel是一位高级web工程师,技术博客www.tutorialsavvy.com的创始人,该博客自2012年创建以来一直被广泛阅读。...
基于GIS的电网生产管理系统建设与应用 本书特色 本书内容包括电力地理信息系统概论、电力gis及其软件平台选择、电力gis的总体框架、基于gis的电网一体化生产...
《香格里拉的茉莉1:深渊之石》内容简介:苏茉莉,一个有着神秘身世的12岁少女,父母几年前相继在探险行动中失踪。中秋节的假期,放
《普通高等教育"十一五"国家规划教材·通信网理论与应用》系统地介绍了通信网的相关理论和技术,主要内容包括通信网的基本概念及
Linux 驱动程序开发实例-第2版 本书特色 Linux设备驱动程序是高级应用程序与硬件设备之间的桥梁。驱动程序开发是软硬件相互结合的技术。本书是一本专门介绍...
《黑客大曝光:恶意软件和Rootkit安全(原书第2版)》内容简介:《黑客大曝光:恶意软件和Rootkit安全(原书第2版)》提供了经过证
由Makerbot创始人之一BrePettis、Fab学院教授AnnaKaziunasFrance和3D打印领域的达人JayShergill所著,介绍了Make...
本书介绍了如何使用Web标准技术来为iPhone和iPad制作Web应用。书中利用最前沿的Web和移动技术,演示了如何使用HTML5来完成繁重的
TCP/IP详解卷2实现 内容简介 本书完整而详细地介绍了TCP/IP协议是如何实现的。书中给出了约500个图例,15000行实际操作的C代码,采用举例教学的方...
《北山酒经(外二种)》内容简介:本书系统总结了前代有关饮酒、酿酒、制曲的重要理论,详述制曲技术与酿酒的工艺过程及各种酒的酿
《沙漠之城》内容简介:埃及,一个充满了妖艳而疯狂气息的沙漠之域。旅行探险家本尼西本想在这里体验一番奇妙的异域风情,探寻传说
《设计思维:建筑设计过程解析(原书第3版)》第二版于1990年出版,之后第三版就一直在不停的改写当中。布莱恩·劳森一直在努力了解
每天,google都要测试和发布数百万个源文件、亿万行的代码。数以亿计的构建动作会触发几百万次的自动化测试,并在好几十万个浏览
本书共分五部分,详细介绍了shell编程技巧,各种UNIX命令及语法,还涉及了UNIX下的文字处理以及少量的系统管理问题。本书内容全面