本书是全国**本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。
本书共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
本书可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。开设相关课程的高等院校与科研机构也可选用本书作为教材。
精选典型实用例程,详解CUDA使用细节,重视理论结合实际,介绍并行程序设计方法,深入分析硬件架构,揭示模型与底层映射关系,精心总结优化经验,解析高性能编程技巧。
第1章 GPU通用计算
目前,主流计算机中的处理器主要是中央处理器CPU和图形处理器GPU。传统上,GPU只负责图形渲染,而大部分的处理都交给了CPU。
21世纪人类所面临的重要科技问题,如卫星成像数据的处理、基因工程、全球气候准确预报、核爆炸模拟等,数据规模已经达到TB甚至PB量级,没有万亿次以上的计算能力是无法解决的。与此同时,我们在日常应用中(如游戏、高清视频播放)面临的图形和数据计算也越来越复杂,对计算速度提出了严峻挑战。
GPU在处理能力和存储器带宽上相对CPU有明显优势,在成本和功耗上也不需要付出太大代价,从而为这些问题提供了新的解决方案。由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽。GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率。图1—1对CPU与GPU中晶体管的数量以及用途进行了比较。
……
张舒,电子科技大学信息与通信工程专业硕士,现任NvIDIA深圳有限公司系统设计验证工程师,CUDA技术顾问。曾实现基于CUDA的神经网络、聚类分析、主分量分析等模式识别算法,以及信号仿真、密码破解、字符串匹配等应用。
《看见5000年》内容简介:作者是良渚考古的参与者、旁观者和传播者。她以记者的身份,戏剧场景式的描写方式,辛勤耕耘,讲述良渚的
广告语英国DK经典作品艺术排行榜冠军姊妹篇独特3D图立体图解析全球最标志建筑!主要卖点•世界建筑史上最著名的50余座全面解析•分
会声会影应用宝典-中文版-随书赠送DVD 本书特色 本书是一本会声会影x7 学习宝典,全书通过310 多个实战案例,以及350 多分钟全程同步语音教学视频,...
C++程序设计教程 内容简介 本教材是为高等学校计算机专业、电类和信息类专业学生学习高级语言程序设计而编写的。本教材根据高级语言程序设计的基本体系编写,结合结构...
《护肤品全解码:100款超人气护肤品成分大检阅》内容简介:现在美容杂志、美容书籍琳琅满目。一些书籍和杂志的介绍过于简单和笼统,
《心理危机干预36计》内容简介:《心理危机干预36计》基于古代军事著作《三十六计》,阐述了36个青少年学生心理危机案例,每个案例
CSSMasteristailor-madeforthewebdesignerwhosreallyseriousabouttakingtheirskillsto...
本书内容完全站在网页制作技术的角度上,从网页必备元素开始,详细而完整地讲解了相关标记,并且用大量范例说明各元素的使用方法
本书语言清晰明了,将设计准则与其核心的认知学和感知科学高度统一起来,使得设计准则更容易地在具体环境中得到应用。涵盖了交互
本书为机电工程师继续教育丛书之一。本书以工程应用为背景,系统地阐述常用人工神经网络的基本原理、学习算法及分析方法,全书共
《3分钟,让公司介绍发光》内容简介:本书聚焦公司介绍的书写和展示,力争实现:用3分钟的介绍,让客户选择,被客户信任,达成合作
本书是大学计算机相关专业的基础课教材,涉及到计算机科学的各个方面。本书着重讲解基本概念而不是数学模型和技术细节,通过大量
本书以每十年为一单位,对20世纪字体的设计历史以及平面设计中的种种问题进行了分析。本书讲述了当今字体设计的各种趋势,这些趋
游戏业在过去30年逐渐成熟,已经成为一种重要的娱乐方式。游戏设计是一项具有创造性、专业性、艺术性的工作。本书是在作者为Sony
《商用机器学习:数据科学实践》内容简介:本书基于我在商学院的教学经验而创作,是关于机器学习的一本入门书籍,读者面向商学院学
JenniferCampbell是多伦多大学计算机科学系高级讲师,本书所基于的课程就是由她创建的。PaulGries是多伦多大学计算机科学系高级讲
《汽车底盘电控系统诊断与维修》内容简介:本书紧密结合现代汽车底盘电控系统诊断与维修生产实际,契合融“教-学-做”为一体的教学
ItsOurResearchprovidesastrategicframeworkforpeoplewhopracticeUXresearchwhowishto...
《7天精通PhotoshopCS5UI交互设计》主要内容简介:Photoshop是美国Adobe公司开发的一款图形图像软件,目前最新的版本是Photoshop
《从零开始做运营》内容简介:运营是什么?怎样做运营?产品和运营是什么关系?我是否适合从事互联网运营?为什么我做的运营活动收