本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
《Unity 5.X 3D游戏开发技术详解与典型案例》内容简介:本书对Unity3D集成开发环境界面、脚本的编写和众多高级特效的实现进行了详细
《界:我奋斗的路》内容简介:本书为自传,分农村锻炼篇、香港学艺篇、回沪创业篇、回馈故乡篇四个部分,讲述了作者从上海到浙江慈
ThefirstcompletereferenceguidetotheessentialWebprotocolAsapplicationsandservices...
《世界顶级时尚品牌&平面设计》的核心是分析23个印刷、颜色选择、展出请柬、网站、香水、化妆品案例,同时探讨时尚设计者和平面设
《医学专业课程思政优秀案例集(基础医学分册)》内容简介:本书精选了上海交通大学医学院众位教师近三年课程思政成果,在基础医学
《智能城市建设中的知识管理与知识服务研究》内容简介:本书通过文献调查、社会调研与现实问题的分析相结合,对智能城市建设中的知
《清华版双语教学用书•数字信号处理:基于计算机的方法(第3版)》于2001年由清华大学出版社推出以来,得到了广大院校师生的一致好评
《15天学会JavaScript(视频教学版)》内容简介:本书从技术和实际应用场景相结合的角度出发,结合当下热门技术(JavaScript、ECMA
《凝固的美:东西方雕塑艺术比较》内容简介:《凝固的美:东西方雕塑艺术比较》以优美洗练的文字,分十八个主题对中西方经典雕塑进
《译前译后》内容简介:《译前译后》主要涉及到笔者多年来翻译并出版过的作品。译前,系译者对原著的认识。译后,这里包括译著的成
秋叶OFFICE WORD EXCEL PPT办公应用从新手到高手 本书特色 零基础无忧:一看就懂,一学就会,马上就能用,短时间完成从Office小白到高手的突...
DigitalCommunicationReceiversSynchronization,ChannelEstimation,andSignalProcessi...
《卑鄙的圣人:曹操10》内容简介:曹操不可避免地步入暮年,统一天下的目标依旧遥遥无期。大瘟疫毁灭生灵无数、南征孙权再度无功而
《活着,本该有趣》内容简介:“中国人的生活意趣”系列精选老舍、汪曾祺和丰子恺的散文代表作130篇,在一篇篇历经时间淘洗的优美散
《可穿戴医疗——移动医疗新浪潮》内容简介:可穿戴设备作为互联网下一阶段的智能载体,已经开始进入人们生活的方方面面,特别是在
如果你希望成为一名职业室内设计师,本书将成为你最能受益的实用手册。其中包含的大量参考信息将带给你对这份职业的无限热情和激
在《设计,该怎么卖?》一书中,作者珍与肯•维索基•奥格雷迪展示了怎样用客户能理解的方式阐释你的设计价值,并赢得客户的青睐。
《通信电路原理学习指导书》共分8章,分别讲述了绪论、滤波器、高频放大器、非线性电路、正弦波振荡器、调制与解调、锁相环路以及
《UML风格(第2版)(英汉对照)》给出了一系列有效提高团队生产效率的编程风格的原则,描述了创建简洁、易于理解的UML图的标准和指南
《安德森18首长笛练习曲 OP.41》内容简介:安德森长笛练习曲系列教程是欧美地区针对长笛演奏使用很普遍的一套教材,在长笛技巧性的