本书是全国**本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。
本书共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
本书可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。开设相关课程的高等院校与科研机构也可选用本书作为教材。
精选典型实用例程,详解CUDA使用细节,重视理论结合实际,介绍并行程序设计方法,深入分析硬件架构,揭示模型与底层映射关系,精心总结优化经验,解析高性能编程技巧。
第1章 GPU通用计算
目前,主流计算机中的处理器主要是中央处理器CPU和图形处理器GPU。传统上,GPU只负责图形渲染,而大部分的处理都交给了CPU。
21世纪人类所面临的重要科技问题,如卫星成像数据的处理、基因工程、全球气候准确预报、核爆炸模拟等,数据规模已经达到TB甚至PB量级,没有万亿次以上的计算能力是无法解决的。与此同时,我们在日常应用中(如游戏、高清视频播放)面临的图形和数据计算也越来越复杂,对计算速度提出了严峻挑战。
GPU在处理能力和存储器带宽上相对CPU有明显优势,在成本和功耗上也不需要付出太大代价,从而为这些问题提供了新的解决方案。由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽。GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率。图1—1对CPU与GPU中晶体管的数量以及用途进行了比较。
……
张舒,电子科技大学信息与通信工程专业硕士,现任NvIDIA深圳有限公司系统设计验证工程师,CUDA技术顾问。曾实现基于CUDA的神经网络、聚类分析、主分量分析等模式识别算法,以及信号仿真、密码破解、字符串匹配等应用。
絕對好看的「視覺最佳化」工具書,「用看的」行銷新概念、好點子!Amazon網路書店[簡報與技能類書]長銷榜首!揭開傑出人們用簡報
笨办法学Ruby-(第3版) 本书特色 本书是一本ruby入门书籍,是《“笨办法”学python》的姊妹篇。本书适合对计算机了解不多,没有学过编程,但对编程感兴...
《考古拾趣》内容简介:本书中的文章长短相宜,浓缩了作者几十年来的田野考古、学术之旅与生活经历。其中有考古发掘古墓的故事,有
《旅游电子商务教程(第三版)》内容简介:本教材采用体验式情景模式,构造了以欧阳逍遥同学为代表的大学生对于旅游电子商务进行探
CG进阶-SAI+Photoshop+ComicStudio动漫线稿绘制技法-全彩印刷-含CD 本书特色 《cg进阶:sai+photoshop+comicst...
《极端的未来:超越未来的十大趋势》一书讲述了石油资源行将告罄,人类将如何面对?气候变化将使地球变得怎么样?惊人发展的医疗科
Java办公自动化项目方案精解(附光盘) 内容简介 本书采用当今*流行的Java语言来实现前台的控制界面。后台数据库考虑到读者的广泛性,采用当今功能*为强大的O...
《一千零一夜》内容简介:《一千零一夜》又名《天方夜谭》,是阿拉伯民间故事集。相传国王山鲁亚尔痛恨王后与人有私,将其杀死,此
《国际平面设计基础教程:GRIDS网格设计》的目的是向读者介绍平面设计中网格的基本运用原则,就像当代设计师们所实践的那样。虽然
《我们的第一个十年》内容简介:从校园到职场,抑或到政坛、到商海,曾经朝夕相处的同窗走出了不同的人生轨迹。这里有在基层默默奋
《信息的社会层面》分析了近年来信息技术对人类社会所产生的冲击,对信息至上论进行了批判性反思。作者认为,信息是植根于社会生
《机器学习算法(原书第2版)》内容简介:本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。
《Java并发编程实战》内容简介:本书深入浅出地介绍了Java线程和并发,是一本完美的Java并发参考手册。书中从并发性和线程安全性的
《Python3.6从入门到精通(视频教学版)》内容简介:本书用于Python编程快速入门,注重实战操作,帮助读者循序渐进地掌握Python3.6
《安藤忠雄连战连败》是安藤忠雄继《安藤忠雄论建筑》一书后,根据其在东京大学建筑系讲课内容整理而成的又一部具有影响力的著作
CAD室内设计施工图常用图块.5 金牌家装实例 本书特色 本图集汇集了住宅室内装饰设计施工图各类实例,是从大量的工程实例中精选出来,经过加工整理,使其典型化,综...
《最新日本设计模板:版面设计》着重对海报、DH、POP、书籍等印刷品的设计和运用进行解说,因为“版面设计”存在于人们生活的方方
《Python游戏设计案例实战》内容简介:本书以Python 3.5为编程环境,从基本的程序设计思想入手,逐步开展Python语言教学,是一本面
《林语堂英文译创研究》内容简介:本书首先以译创者主体性研究为起点,将林语堂界定为译创者,分析其在双重身份作用之下的译创动机
书围绕着动态内存自动回收的话题,介绍了垃圾收集机制,详细分析了各种算法和相关技术。本书共12章。第1章首先介绍计算机存储器管