本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
精彩纷呈的科学家传记视角独特的科学史研究【编辑推荐】全面地对科学家的精神气质和杰出科学成就进行研究,并将其深入浅出地表述
《李小龙信札:功夫、表演和生命》内容简介:这本信札集记载了李小龙从赴美国求学到在香港逝世之间的十五年珍贵时光。在这些寄给家
《多模态警示语的整体意义建构》内容简介:《多模态警示语的整体意义建构》为“当代外语研究论丛”之一,主要运用巴赫金的对话理论
那是一個不羈的年代:一個充滿示威抗議、迷幻藥實驗、反傳統社群,和無政府理想主義的時代。一九六○年代,美國社會歷經大幅動盪
《华为内训(新版)》内容简介:翻开《华为内训》,您将步入一个炫目恢宏的商业世界,由此洞悉华为内部独特的管理经营机制。作为世
差不多十年前,我(Martin)曾经和KentBeck一起做过一个项目。这个项目的名字叫C3,它后来成为极限编程诞生的标志性项目,并帮助
《萌物绘:实用水彩手绘入门教程》内容简介:本书分为四大部分:工具篇、色彩篇、基础篇、实践篇。以甜品、花卉、动物三大萌物主题
算法导论 本书特色 ●算法领域的标准教材,全球多所知名大学选用●MIT名师联手铸就,被誉为“计算机算法的圣经”●教学网址、视频课程及在线学习中心,全方位学习模式...
《编程语言实现模式》旨在传授开发语言应用(工具)的经验和理念,帮助读者构建自己的语言应用。这里的语言应用并非特指用编译器
PaulRandwasoneoftheworldsleadinggraphicdesigners.Herehedescribeshisworkwiththesa...
《守护城市家园:中国城管执法40年》内容简介:城市化是社会发展的必然结果,也是推动社会发展的重要机制。当代中国的快速城市化从
本书是C++程序员进阶修炼的必读之作,包含的全部都是C++编码的最佳实践,从语法、编码规范和编程习惯、程序架构和设计思想等三大
《意志力红利》内容简介:迷茫、拖延、失控、坚持不下去…… 如何走出痛苦、混乱、低谷的状态? 要做成一件事,真的好难! 为什么有
欧洲人用他们的浪漫洒脱,以及悠久的艺术传统造就了欧洲设计在世界上独树一帜的风采。本书汇集了奥地利著名设计学院历年的学生作
《做东:酒局里的100个生存哲学》内容简介:酒局是阴谋四伏的人性的斗争舞台,是人最高生存智慧的展示场所。《做东》是第一本最全面
《三维CAD/CAM》内容简介:结合机械类专业的实际,以够用为度,主要讲述设计模块和加工模块。第一部分为设计模块(即CAD模块),主
《远去的都市:1950年代的上海》内容简介:有人说上海史是历史学界的“宠儿”,一直受到特别的关注,确实如此。魏斐德、李欧梵、叶
《财神的名单》内容简介:跟你讲的是18个商业大人物成功背后的故事。阅读着他们的精彩,既丰富了谈资,也可以思考一下自己的人生。
《互联网金融弄潮儿——第三方支付》内容简介:本书从市场的角度,通过认真的调查与分析,以实际案例为导向,由浅入深,分板块串联
网络操作原理 内容简介 《网络操作系统》全面、系统地论述了网络操作系统的基本概念、基本原理以及相关技术,反映了当代计算机网络操作系统发展的新动向、新水平。全书共...