本书是全国**本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。
本书共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
本书可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。开设相关课程的高等院校与科研机构也可选用本书作为教材。
精选典型实用例程,详解CUDA使用细节,重视理论结合实际,介绍并行程序设计方法,深入分析硬件架构,揭示模型与底层映射关系,精心总结优化经验,解析高性能编程技巧。
第1章 GPU通用计算
目前,主流计算机中的处理器主要是中央处理器CPU和图形处理器GPU。传统上,GPU只负责图形渲染,而大部分的处理都交给了CPU。
21世纪人类所面临的重要科技问题,如卫星成像数据的处理、基因工程、全球气候准确预报、核爆炸模拟等,数据规模已经达到TB甚至PB量级,没有万亿次以上的计算能力是无法解决的。与此同时,我们在日常应用中(如游戏、高清视频播放)面临的图形和数据计算也越来越复杂,对计算速度提出了严峻挑战。
GPU在处理能力和存储器带宽上相对CPU有明显优势,在成本和功耗上也不需要付出太大代价,从而为这些问题提供了新的解决方案。由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽。GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率。图1—1对CPU与GPU中晶体管的数量以及用途进行了比较。
……
张舒,电子科技大学信息与通信工程专业硕士,现任NvIDIA深圳有限公司系统设计验证工程师,CUDA技术顾问。曾实现基于CUDA的神经网络、聚类分析、主分量分析等模式识别算法,以及信号仿真、密码破解、字符串匹配等应用。
《实用古玉辨伪》内容简介:本书共分8章:古玉发展概述、古玉辨伪方法、古代玉料辨识、古代治玉工艺、古玉作伪、学习古玉辨识的推荐
本书将可扩展文本标记语言XHTML和层叠样式表CSS技术整合为统一的整体。读者可同时学习HTML和CSS,从网页设计的开始,就能知道如何
《RESTful Web APIs中文版》内容简介:本书是针对RESTful API的实用指南,通过展示各种用来创建高可用应用的强大工具,讲解REST的深
《世界航空发动机手册》共分为4个部分。主体部分有:涡轮风扇发动机、涡轮喷气发动机、涡轮轴/涡轮螺旋桨发动机、桨扇发动机、活
《用管理驱动销售》内容简介:本书从组织发展和战略达成的角度阐述了如何展开全面的、系统的销售管理工作,旨在帮助企业打造具有自
DiveintogamedevelopmentandcreategreatmultiplayeronlinegameswithProAndroidWebGame...
《无穷的远方,无数的人们,都和我有关》内容简介:《无穷的远方,无数的人们,都和我有关:鲁迅散文随笔精选》由著名学者、鲁迅研
MobileInteractionDesignshiftsthedesignperspectiveawayfromthetechnologyandconcent...
《HTML+CSS+JavaScript网页制作案例教程》内容简介:Web标准的最大特点是采用HTML+CSS+JavaScript将网页内容、外观样式及动态效...
《徐兆玮杂著七种》内容简介:徐兆玮(1867—1940),民国学者、藏书家。字少逵,号倚虹,又号虹隐,别署剑心,江苏常熟人。《徐兆
ARDUINO零基础C语言编程/孙秋凤 内容简介 本书是基于Arduino设计的入门书籍,书中讲解了Arduino的语法和各种案例,主要包括Arduino的编程...
《C++从入门到项目实践(超值版)》内容简介:本书采取“基础知识→核心应用→核心技术→高级应用→行业应用→项目实践”结构和“由
本书内容包括UNIX内核体系结构磁盘高速缓冲机制文件系统内部数据结构与算法控制进程上下文的系统调用与进程调度存储管理,包括对
《Excel数据分析与可视化》内容简介:本书以项目为导向,由浅入深地介绍Excel在数据分析与可视化方面的应用。全书以“自动售货机”
在计算机发展的历史上,没有哪一种程序设计语言像C语言这样应用广泛。本书是C语言的设计者之一DennisM.Ritchie和著名计算机科学家
本书的编写基于Malmö大学实体原型(PhysicalPrototyping)实验室的教学内容。PhysicalPrototyping实验室是最早建立Ardui...
《高等教育评论(2017年第1期 第5卷)》内容简介:本书致力于学术前沿研究,为国内外教育界同仁创造一个宽松活跃的学术空间,为推动
《HarmonyOS应用开发》内容简介:本书内容基于HarmonyOS 2.0 Beta版。从技术层面上讲,HarmonyOS目前可以使用Java和JavaSc...
《公关生涯:从小白到国际公关人》内容简介:本书是国际能源巨头亚太区公关负责人近30年的经验总结。作者从跨国公司第一位本土公共
《行云集》内容简介:《行云集》为周瘦鹃先生随笔集,包括“新西湖”“秋栖霞”“万古飞不去的燕子”“南湖的颂歌”“双洞江南第一