本书由微软资深企业架构师兼Kinect应用开发专家亲自执笔,既系统全面地讲解了Kinect技术的工作原理,又细致深入地讲解了Kinect交互设计、程序开发和企业应用展望。全书不仅包含大量实践指导意义极强的实战案例,还包含大量建议和最佳实践,是学习Kinect for Windows应用开发不可多得的参考书。
本书分为八大部分:准备篇(引言和第1章),从科幻电影的自然人机交互技术谈起,同时针对虚拟现实、增强现实、多点触摸、语音识别、眼球跟踪、人脸识别、体感操作、脑机界面等人机交互技术的最新发展动态,结合一些生动例子进行了说明;原理篇(第2~3章),深入剖析了Kinect的硬件组成,从原理上分析了Kinect的工作机制,并从计算机视觉技术角度重点分析了“体感操作”背后发生的一切;基础篇(第4~5章),对Kinect for Windows SDK进行了框架性的导读,并对Kinect自然人机交互的设计提出了有益的归纳和建议;开发篇(第6~9章),本篇从Kinect的开发环境准备谈起,内容包括了视频数据、深度数据、骨骼跟踪等开发示例,其中还包含一个用Kinect测量身高的有趣示例;实例篇(第10~16章),通过介绍一些生动有趣的应用示例(《超级马里奥兄弟》、《水果忍者》等)的开发,帮助读者快速开发入门;进阶篇(第17~19章),包括姿态识别和手势识别的算法实现,Kinect技术结合3D技术的应用,同时结合Kinect在手术室的原型应用这一综合示例,将交互设计、骨骼跟踪、手势识别、语音识别等关键点“串烧”起来;展望篇(第20~22章),汇集Kinect应用的相关创意和奇思妙想,以及Kinect在医疗、教育、动作捕捉、虚拟现实、增强现实、动漫设计乃至冰川研究等诸多领域的发展前景;附录A是关于Kinect SDK命名空间Microsoft Kinect的详细介绍;附录B是关于自然人机交互技术、计算机视觉技术的相关开源社区动态的介绍。
推荐序一
推荐序二
前言
第一部分 准备篇
引 言 从科幻电影谈起/2
第1章 自然人机交互技术漫谈/10
1.1 自然人机交互技术的发展/10
1.1.1 第六感设备:技术的组合创新/10
1.1.2 追影技术:摄像头也疯狂/12
1.1.3 虚拟现实:真实的体验场景/13
1.1.4 增强现实:真实与虚拟的叠加/14
1.1.5 多点触摸:信息就在指尖 /15
1.1.6 语音识别:从ViaVoice到Siri/16
1.1.7 眼球跟踪:从霍金的座椅谈起/17
1.1.8 人脸识别:Photo DNA/19
1.1.9 体感操作:达芬奇手术机器人/20
1.1.10 脑机界面:霍金座椅的升级版/20
1.2 “你就是控制器”—Kinect宣言/21
1.2.1 Kinect销售记录及命名来历/21
1.2.2 未来照进现实/22
第二部分 原理篇
第2章 揭开Kinect的神秘面纱—硬件设备解剖/26
2.1 两款Kinect传感器对比/26
2.2 Kinect传感器的硬件组成/28
2.2.1 Kinect的“心脏”—PS1080 SoC/30
2.2.2 Kinect的“三只眼”—投影机和两个摄像头/32
2.2.3 Kinect的“四只耳朵”—麦克风阵列/34
2.2.4 会摇摆的“相控雷达”—传动马达/35
2.2.5 姿态控制—三轴加速度计/36
2.2.6 USB接口及电源/37
2.2.7 Kinect风扇控制/38
2.3 Kinect相关技术规格/38
2.3.1 Kinect近景模式/39
2.3.2 Kinect放大镜/40
2.4 本章小结/40
第3章 Kinect工作原理大揭秘/41
3.1 Kinect for Xbox 360的产品设计/42
3.2 基于“管道”的系统架构/43
3.2.1 骨骼跟踪/45
3.2.2 动作识别/46
3.2.3 人脸识别/48
3.2.4 语音识别/49
3.3 Kinect眼里的三维世界/50
3.3.1 深度数据是Kinect的精髓/51
3.3.2 2D视觉与3D视觉/55
3.4 深度图像成像原理/56
3.4.1 ToF光学测距与结构光测量/56
3.4.2 Light Coding技术/57
3.4.3 激光散斑原理/58
3.4.4 光源标定/59
3.5 从深度图像到骨骼图/60
3.5.1 动静分离,识别人体/60
3.5.2 人体部位分类/62
3.5.3 从人体部位识别关节/63
3.5.4 会“机器学习”的“Kinect大脑”/65
3.5.5 骨骼跟踪的精度和效率/68
3.6 创建你的Avatar/70
3.6.1 “有骨有肉”/70
3.6.2 泊松方程噪声滤除/70
3.6.3 粗糙变平滑、缺陷自动补齐/71
3.7 本章小结/71
第三部分 基础篇
第4章 Kinect for Windows SDK导读/74
4.1 什么是Kinect SDK/74
4.1.1 Kinect SDK的发展历程/74
4.1.2 SDK v1.5的新特性/75
4.1.3 SDK v1.5尚未提供的API/76
4.1.4 从底层进行封装/76
4.2 Kinect for Windows体系架构/78
4.3 应用层API详解/80
4.3.1 Kinect的核心NUI API/80
4.3.2 Kinect Audio DMO/82
4.3.3 Windows Speech SDK/83
4.4 数据流概述/84
4.4.1 彩色图像数据/84
4.4.2 用户分割数据/85
4.4.3 深度图像数据/86
4.4.4 如何获取数据流/87
4.5 骨骼跟踪/89
4.5.1 骨骼信息检索/90
4.5.2 主动跟踪和被动跟踪/90
4.5.3 骨骼跟踪对象选择/91
4.6 NUI坐标转换/92
4.6.1 深度图像空间坐标/93
4.6.2 骨骼空间坐标/93
4.6.3 坐标变换/93
4.6.4 传感器阵列和倾斜补偿/95
4.6.5 地面测量/95
4.6.6 骨骼镜像/95
4.7 本章小结/96
第5章 Kinect用户交互设计的若干思考/97
5.1 Xbox 360 Kinect Hub界面和Metro风格/97
5.1.1 什么是Metro风格/97
5.1.2 Kinect Hub手势原型设计/98
5.1.3 “悬停选择”和“翻页控制”/99
5.2 体感游戏的优势及局限性/100
5.2.1 更多的自由度/101
5.2.2 关节点重叠的处理办法/102
5.2.3 情感因素和心理暗示/102
5.2.4 Kinect体感操作的局限性及对策/103
5.3 用户交互的趋势和新特性/104
5.3.1 Kinect使交互“柔软化”/105
5.3.2 用户交互设计也可能是一项专利/106
5.4 Kinect“体感操作”交互设计的七条军规/106
5.4.1 控制手势集符合人类自然手势/107
5.4.2 让用户的肢体移动幅度尽可能小/107
5.4.3 操作界面的对象采用Metro风格/109
5.4.4 “确认操作”保持简单、一致/109
5.4.5 手势操作尽可能在同一个平面内/110
5.4.6 从三维的视角去看交互设计/110
5.4.7 配有简单明了的手势说明/111
5.5 本章小结/112
第四部分 开发篇
第6章 开发前的准备工作/114
6.1 开发Kinect应用所需的技能/114
6.2 系统要求/115
6.3 下载和安装Kinect SDK/116
6.3.1 Kinect for Windows SDK v1.5/118
6.3.2 Developer Toolkit/118
6.3.3 Kinect快速开发工具箱/119
6.3.4 XNA开发环境/119
6.4 加载驱动、检验及测试/120
6.5 配置开发环境/122
6.6 要点和故障排除/122
6.7 本章小结/123
第7章 Hello,Kinect!/124
7.1 一行代码的“Hello, Kinect!”/124
7.1.1 创建WPF工程/124
7.1.2 添加KinectDiagnosticViewer控件/126
7.1.3 编写一行代码/127
7.1.4 编译运行/127
7.2 控制台界面HelloKinectMatrix/128
7.2.1 创建Console工程/128
7.2.2 编写代码/129
7.2.3 运行效果/130
7.3 KinectContrib快速工程模板/130
7.4 KinectWpfViewers工具控件/131
7.5 本章小结/132
第8章 Kinect开发循序渐进/133
8.1 一个简单的编程模型/133
8.1.1 初始化、启用Kinect设备/134
8.1.2 彩色图像流事件处理/136
8.1.3 深度数据捕获/138
8.1.4 骨骼跟踪/141
8.1.5 关闭Kinect设备/145
8.1.6 Kinect设备状态管理及异常处理/145
8.2 更专业的深度图/146
8.2.1 改进转换方法/146
8.2.2 事件处理/148
8.3 控制Kinect仰角/148
8.3.1 “你的塑身”游戏/149
8.3.2 垂直调整Kinect仰角/150
8.4 本章小结/151
第9章 Kinect深度数据测量技术及应用/152
9.1 什么是Kinect视角场/152
9.2 深度值与实际距离的对比/153
9.3 深度图像的直方图/155
9.3.1 直方图统计信息的价值/156
9.3.2 深度图像直方图的意义/158
9.4 Kinect深度数据测量的应用/159
9.4.1 近景模式:自动锁屏工具/159
9.4.2 Kinect视角场几何推导:测量人体身高/163
9.4.3 近距离探测:制作地形电子沙盘/169
9.5 本章小结/170
第五部分 实例篇
第10章 用Kinect表演“变脸”/172
10.1 在人的面部变换脸谱/172
10.2 代码实现/173
10.2.1 WPF工程、控件及初始化/173
10.2.2 骨骼跟踪/176
10.2.3 变脸及坐标变换/178
10.3 合理暂停骨骼跟踪/181
10.4 道具平滑跟随/181
10.5 调整幕布大小/183
10.6 练习作业/184
第11章 用Kinect唤起“红白机”的回忆/185
11.1 用身体控制马里奥/185
11.2 代码实现/185
11.2.1 WPF工程、控件及初始化/185
11.2.2 模拟键盘输入工具类/188
11.2.3 肢体语言映射到键盘事件/192
11.3 副产品:PPT演示“空手道”/193
11.4 练习作业/195
第12章 用Kinect玩PC版的《水果忍者》/197
12.1 空气鼠标设计思路/197
12.1.1 找到离Kinect最近的那个人/198
12.1.2 兼容左手习惯和右手习惯/199
12.1.3 从骨骼坐标系到鼠标坐标系/199
12.1.4 模拟鼠标工具类/200
12.1.5 让“空气鼠标”移动自如/202
12.1.6 模拟鼠标左键事件/203
12.2 在PC中用Kinect玩《水果忍者》/203
12.2.1 核心代码示例/203
12.2.2 如何双手挥刀/206
12.3 更多游戏:《割绳子》/206
12.4 练习作业/207
第13章 创建你的Kinect Hub Demo界面/208
13.1 Metro风格界面设计/208
13.2 使用Kinect骨骼跟踪/209
13.3 使用Coding4Fun Kinect Toolkit开发加速器/210
13.4 悬停选择/210
13.5 本章小结/213
第14章 用Kinect导播天气预报/214
14.1 天气预报是这样炼成的/214
14.1.1 绘制幕布,定义前景图片/214
14.1.2 对象定义及初始化/215
14.1.3 实现“画中画”效果/216
14.2 一些优化的话题/219
14.2.1 使用Using及时回收资源/219
14.2.2 使用WriteableBitmap优化图片显示性能/219
14.2.3 多线程和“轮询模型”/220
14.2.4 使用中值滤波边缘去噪/220
14.3 Kinect语音导播切换/221
14.3.1 引用Microsoft.Speech命名空间/221
14.3.2 音频数据流和语音识别引擎/221
14.3.3 语音识别事件/223
14.4 本章小结/224
第15章 基于Kinect的家庭监控系统/225
15.1 通过Kinect进行目标探测/225
15.2 使用计算机视觉库/226
15.2.1 Open CV程序库/226
15.2.2 Emgu CV引用/226
15.2.3 保存快照/227
15.2.4 录制视频/227
15.3 目标人体探测和影像录制/228
15.4 扩展功能和更多应用场景/231
15.5 本章小结/231
第16章 “Kinect牌”梦境录音笔/232
16.1 Kinect音频采集/232
16.1.1 使用音频数据流/232
16.1.2 “波束跟踪”信心值的另类用法/233
16.2 音频录制/233
16.2.1 WAV文件/233
16.2.2 WAVEFORMATEX结构体/234
16.2.3 梦境录音笔的实现/234
16.3 练习作业/240
第六部分 进阶篇
第17章 再谈姿态识别和手势识别/242
17.1 姿态和手势/242
17.2 动作与算法/243
17.2.1 如何设定动作集合/243
17.2.2 借鉴正则表达式和状态机/244
17.2.3 转换为几何三角问题/245
17.3 常见手势识别/245
17.3.1 挥手激活/245
17.3.2 悬停按钮/246
17.3.3 磁石悬停/247
17.3.4 划动手势/247
17.3.5 滑动解锁/248
17.3.6 推按钮/249
17.3.7 通用暂停/249
17.4 工具介绍/250
17.4.1 动作录制和识别GesturePak/250
17.4.2 手和手指的“空气多点触摸”/251
17.5 本章小结/253
第18章 Kinect在手术室的应用原型/254
18.1 原型设计/254
18.2 交互设计/255
18.2.1 “悬停选择”进行功能导航/255
18.2.2 “空气鼠标”的激活和隐藏/256
18.2.3 通过“划动”手势翻阅医学影像/257
18.2.4 放大、缩小医学影像病灶部位/257
18.2.5 “垂直摆动”翻阅病历/258
18.2.6 体感操作结合语音控制/258
18.3 体感操作的实现/259
18.3.1 基于SwipeGestureRecognizer/259
18.3.2 基于单个部位运动序列的轨迹分析匹配/262
18.3.3 基于多个部位姿态快照的状态机匹配/266
18.4 利用SDK v1.5的新特性/280
18.4.1 近景模式下的上半身骨骼跟踪/280
18.4.2 利用关节点朝向信息进行手势识别和三维操作/280
18.4.3 人脸识别用于手术登录验证/283
18.4.4 调试工具Kinect Studio/283
18.5 本章小结/284
第19章 Hello,Kinect 3D World! /285
19.1 点、面、云/285
19.1.1 像素和彩色图像帧/285
19.1.2 深度图像帧和点云/285
19.1.3 多Kinect设备的接入/286
19.2 Kinect体感应用开发工具简介/287
19.2.1 软件开发平台XNA/287
19.2.2 游戏引擎Unity 3D/288
19.2.3 3D场景重建工具ReconstructMe/289
19.3 本章小结/289
第七部分 展望篇
第20章 奇思妙想—Kinect效应/292
20.1 四旋翼飞行器的“导航雷达”/292
20.2 宠物看护机器人/292
20.3 空气吉他/293
20.4 倒车雷达系统/294
20.5 Kinect购物车/294
20.6 魔术道具/295
20.7 本章小结/295
第21章 Kinect企业级应用/296
21.1 思维导图/296
21.2 体感操作应用/297
21.2.1 手术室/297
21.2.2 体育运动竞技研究/297
21.2.3 动作捕捉、CG动画制作/298
21.2.4 虚拟试衣镜/298
21.2.5 课堂/299
21.2.6 虚拟汽车展厅/299
21.2.7 管理你的银行账户/300
21.2.8 聋哑人的同声翻译/300
21.3 深度数据应用/301
21.3.1 老年人监护/301
21.3.2 康复训练/301
21.3.3 家庭监控系统/302
21.3.4 道路交通稽查/302
21.3.5 冰川消融研究/303
21.3.6 给宇航员称体重/304
21.4 实物3D建模应用/304
21.4.1 实物3D数字化/304
21.4.2 文物3D模型“数字敦煌”计划/305
21.4.3 3D扫描和打印/306
21.5 机器人视觉与控制/306
21.5.1 地震搜救机器人/307
21.5.2 深海探测机器人/307
21.5.3 工程机械臂控制/307
21.6 本章小结/308
第22章 下一代人机交互技术/309
22.1 下一代Kinect技术若干猜想/309
22.2 未来惊鸿一瞥/310
第八部分 附录
附录A Kinect SDK命名空间速查手册 /312
附录B 推荐阅读及网络资源/328
后记/338
参考资料/339
本书是《计算机网络》的第2版,全面讲述计算机网络的基本原理、技术与应用。从技术内容上,全书共分5个部分。第1部分介绍计算机网
本书是极负盛名的C语言入门经典教材,其第一版发行至今已有20年的历史。本书内容详实全面,由浅入深,示例丰富,并在每个章节后面
《文化产业精要读本》内容简介:本书结构完整,共计八章,大致分为四大部分。第一部分涵盖了第一、二章,重点介绍文化产业的基本知
机器学习-实用案例解析 本书特色 《机器学习:实用案例解析》是机器学习和数据挖掘领域的经典图书,基础理论与实践完美的结合,是一部逻辑紧密、内容详实,适合所有相关...
想象你正在攀登一座名为“软件开发”的山峰。本书是与你同登一座山峰的敏捷先驱所带来的话语与图片。他在崎岖的山路边找到相当平
《企业会计准则原文、应用指南案例详解(2023年版)》内容简介:企业会计准则是会计从业人员进行会计确认、会计计量、会计报告的基
R语言编程艺术 本书特色 著名计算机科学家兼统计学家撰写,R语言领域公认经典著作。从纯编程角度系统讲解R语言的数据结构、编程结构、语法、TCP/IP网络编程、并...
对于初学者,尤其是没有编程经验者来说,这是一本可以快速上手,真正面向应用的好教材。本书展示了Java在面向对象、事件驱动等程序设
《Python安全攻防》内容简介:随着近几年互联网的发展,Python在各行各业发挥着举足轻重的作用。除应用在科学计算、大数据处理等人
《大数据时代的人力资源管理》内容简介:本书采取人物对话的形式,用讲故事的方法,将人力资源管理中一些典型的问题用高级数据分析
HIGHLIGHTAninsidersperspectiveontheASP.NETMVCframework,ahighly-anticipatedproduc...
《禅学指归》内容简介:本书收录了胡适论述中国佛教及禅宗的文章。胡适本人不信任何宗教。然而,说到对佛教和禅宗的研究,作为研究
C游戏编程从入门到精通-(第2版)(配1张光盘) 目录 第1章文本格式游戏1.1文本模式游戏制作1.1.1文本窗口函数1.1.2INT10中断功能1.2猜数字游...
《深入实践Spring Boot》内容简介:本书以丰富的实例,介绍了如何使用Spring Boot开发框架进行基础应用和分布式应用等方面的开发,
本书从操作系统原理的角度,详细解析了Windows如何实现现代操作系统的各个关键部件,包括进程、线程、物理内存和虚拟内存的管理,
Scikit-Learn与TensorFlow机器学习实用指南 本书特色 TensorFlow是一个采用数据流图(data flow graphs),用于数值计...
《近代法律人的世界》内容简介:本书为中国社会科学院近代史研究所法律史研究群、华中科技大学近代法研究所、华东政法大学法律文明
《成为小作家》内容简介:这是一本教你创作自己故事的写作魔法宝典。里面有你能想到的、想不到的写作工具,是助你破解写作难题的基
在这本新书《实现模式》里面,KentBeck将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现
《声学基础》声学是一门既古老又迅速发展着的学科,近年来已渗透到几乎所有重要的自然科学和工程技术领域,并已融入于当代科学技