本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
《小公司财税管控全案》内容简介:本书结合企业财税政策,通过系统的财税管理与控制方案让企业尤其是中小企业财务管理摆脱无顶层设
CCNA学习指南 本书特色 本学习指南帮你准备*新的ccna考试:cisco网络权威todd lammle编写的这本*畅销的学习指南能帮助你仔细的准备,信心十足...
《海外征程2》内容简介:本书改编自华为前员工的真实经历,讲述了海外开拓者在海外拼搏的热血故事。拉美市场的战斗正式打响。4G网络
《多工位级进模实例精选》内容简介:本书结合现代模具企业对模具设计师的工作要求,以先进、实用、通用为目的。全书分为2篇,每篇各
《极简父母法则:教出快乐、自信、独立的孩子》内容简介:爱默生曾经说过,我们为孩子的美丽和幸福感到极大的欢乐,这欢乐使我们的
《手把手教你画素描:人物速写(修订版)》内容简介:素描到底应怎样画?什么才是正确、规范的绘画步骤?绘画初学者与自学者一定会
《对话:21位重塑当代摄影的艺术家》内容简介:本书是当代影像学者、作家傅尔得近年来对当下具有影响力和潜力的国际摄影艺术家的访
计算机基础及MS Office应用-全国计算机等级考试一级教程-(2017年版) 内容简介 张彦、苏红旗、于双元、刘桂山、王永滨所编的《全国计算机等级考试一级教...
《刑法最新立法争议问题研究》内容简介:本书以《刑法修正案(九)》修法过程中及修法前后各方的意见、建议为主要研究对象,梳理、
微型计算机原理与接口技术 内容简介 本书是根据高等理工科院校电子通信工程、自动化、机电一体化等非计算机专业和计算机专业的《微型计算机原理与接口技术》的教学大纲编...
《人工智能发展报告(2020—2021)》内容简介:本书是国家工业信息安全发展研究中心在对2020年全球人工智能技术和产业进行全面跟踪
《历史名镇:孟河镇》内容简介:孟河镇位于江苏省常州市西北,是一个依山傍水、风景秀丽、四季分明的宜农耕、宜居住的理想地区。孟
《交换技术》系统介绍了交换技术的基本概念和工作原理,着重讨论当前通信网各种基本的交换技术,以循序渐进的方式和比较分析的观
《大跨越:中国电信业三十春秋》以记人记事的方式,生动地再现了中国电信业30年波澜壮阔的历史。全书共分十八章,以重大事件为线索
中文版Dreamweaver 8网页设计-轻松现场实战 内容简介 Dreamweaver8是Macromedia公司的*新产品。它集成了可视化Web页面制作、网...
《幸福假面》内容简介:琼是个彻底务实的人,从小只想过安稳的日子;她挑有前途的律师结婚、阻止丈夫追求田园生活,也要求三个孩子
《亲子关系:决定孩子一生幸福的密码》内容简介:本书主要分为“好的亲子关系是家庭教育成功的基石”、“父母心中的亲子关系困惑”
作为jQueryMobile的入门级读物,BradBroulik所著的《jQueryMobile快速入门》以示例方式讲解了jQueryMobile的基本知识和核...
《Excel财务数据处理与分析自动化案例视频精讲》内容简介:财务人员每天都在处理各种各样的表格,计算各种各样的数据,然而,有些财
《DTPWORLD》隶属于日本WorksCorporationInc.。这是一家以研究和推广计算机应用与数位媒体印刷设计的专业出版社,旗下包括《CGWo