书刊介绍
《Python计算机视觉编程》内容简介
《python计算机视觉编程》是计算机视觉编程的权威实践指南,依赖python语言讲解了基础理论与算法,并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外,书中附带的练习还能让读者巩固并学会应用编程知识。
《python计算机视觉编程》适合的读者是:有一定编程与数学基础,想要了解计算机视觉的基本理论与算法的学生,以及计算机科学、信号处理、物理学、应用数学和统计学、神经生理学、认知科学等领域的研究人员和从业者。
Jan Erik Solem 瑞典隆德大学副教授(数学成像小组),Polar Rose公司创始人兼CTO,计算机视觉研究者,Python爱好者,技术图书作家,经常出席各种计算机视觉、图像分析、机器智能等国际会议并发表演讲。他主要关注3D重建、变分问题与优化、图像分割与识别、形状分析,有多年Python计算机视觉教学、研究和行业应用经验,技术博客为http://www.janeriksolem.net。另著有Computing with Python: An Introduction to Python for Science and Engineering一书。作品目录
Python计算机视觉编程
O'Reilly
Media,
Inc.
介绍
业界评论
推荐序
前言
先决条件和概述
读者须知
本书内容
各章概览
计算机视觉简介
Python和NumPy
排版约定
使用代码示例
Safari®
Books
Online
联系我们
致谢
第
1、章:基本的图像操作和处理
1.1、PIL:Python图像处理类库
1.1.1、转换图像格式
1.1.2、创建缩略图
1.1.3、复制和粘贴图像区域
1.1.4、调整尺寸和旋转
1.2、Matplotlib
1.2.1、绘制图像、点和线
1.2.2、图像轮廓和直方图
1.2.3、交互式标注
1.3、
NumPy
1.3.1、图像数组表示
1.3.2、灰度变换
1.3.3、图像缩放
1.3.4、直方图均衡化
1.3.5、图像平均
1.3.6、图像的主成分分析(PCA)
1.3.7、使用
pickle
模块
1.4、SciPy
1.4.1、图像模糊
1.4.2、图像导数
1.4.3、形态学:对象计数
1.4.4、一些有用的
SciPy
模块
1.5、高级示例:图像去噪
练习
代码示例约定
第
2、章:局部图像描述子
2.1、Harris角点检测器
在图像间寻找对应点
2.2、SIFT(尺度不变特征变换)
2.2.1、兴趣点
2.2.2、描述子
2.2.3、检测兴趣点
2.2.4、匹配描述子
2.3、匹配地理标记图像
2.3.1、从Panoramio下载地理标记图像
2.3.2、使用局部描述子匹配
2.3.3、可视化连接的图像
练习
第
3、章:图像到图像的映射
3.1、单应性变换
3.1.1、直接线性变换算法
3.1.2、仿射变换
3.2、图像扭曲
3.2.1、图像中的图像
3.2.2、分段仿射扭曲
3.2.3、图像配准
3.3、创建全景图
3.3.1、RANSAC
3.3.2、稳健的单应性矩阵估计
3.3.3、拼接图像
练习
第
4、章:照相机模型与增强现实
4.1、针孔照相机模型
4.1.1、照相机矩阵
4.1.2、三维点的投影
4.1.3、照相机矩阵的分解
4.1.4、计算照相机中心
4.2、照相机标定
4.2.1、一个简单的标定方法
4.3、以平面和标记物进行姿态估计
4.4、增强现实
4.4.1、PyGame和PyOpenGL
4.4.2、从照相机矩阵到OpenGL格式
4.4.3、在图像中放置虚拟物体
4.4.4、综合集成
4.4.5、载入模型
练习
第
5、章:多视图几何
5.1、外极几何
5.1.1、一个简单的数据集
5.1.2、用
Matplotlib
绘制三维数据
5.1.3、计算F:八点法
5.1.4、外极点和外极线
5.2、照相机和三维结构的计算
5.2.1、三角剖分
5.2.2、由三维点计算照相机矩阵
5.2.3、由基础矩阵计算照相机矩阵
5.3、多视图重建
5.3.1、稳健估计基础矩阵
5.3.2、三维重建示例
5.3.3、多视图的扩展示例
5.4、立体图像
计算视差图
练习
第
6、章:图像聚类
6.1、K-means聚类
6.1.1、
SciPy
聚类包
6.1.2、图像聚类
6.1.3、在主成分上可视化图像
6.1.4、像素聚类
6.2、层次聚类
图像聚类
6.3、谱聚类
练习
第
7、章:图像搜索
7.1、基于内容的图像检索
从文本挖掘中获取灵感——矢量空间模型
7.2、视觉单词
创建词汇
7.3、图像索引
7.3.1、建立数据库
7.3.2、添加图像
7.4、在数据库中搜索图像
7.4.1、利用索引获取候选图像
7.4.2、用一幅图像进行查询
7.4.3、确定对比基准并绘制结果
7.5、使用几何特性对结果排序
7.6、建立演示程序及Web应用
7.6.1、用CherryPy创建Web应用
7.6.2、图像搜索演示程序
练习
第
8、章:图像内容分类
8.1、K邻近分类法(KNN)
8.1.1、一个简单的二维示例
8.1.2、用稠密SIFT作为图像特征
8.1.3、图像分类:手势识别
8.2、贝叶斯分类器
用PCA降维
8.3、支持向量机
8.3.1、使用LibSVM
8.3.2、再论手势识别
8.4、光学字符识别
8.4.1、训练分类器
8.4.2、选取特征
8.4.3、多类支持向量机
8.4.4、提取单元格并识别字符
8.4.5、图像校正
练习
第
9、章:图像分割
9.1、图割(Graph
Cut)
9.1.1、从图像创建图
9.1.2、用户交互式分割
9.2、利用聚类进行分割
9.3、变分法
练习
第
10、章:OpenCV
10.1、OpenCV的Python接口
10.2、OpenCV基础知识
10.2.1、读取和写入图像
10.2.2、颜色空间
10.2.3、显示图像及结果
10.3、处理视频
10.3.1、视频输入
10.3.2、将视频读取到
NumPy
数组中
10.4、跟踪
10.4.1、光流
10.4.2、Lucas-Kanade算法
10.5、更多示例
10.5.1、图像修复
10.5.2、利用分水岭变换进行分割
10.5.3、利用霍夫变换检测直线
练习
附录
A
安装软件包
A.1、
NumPy
和
SciPy
A.1.1、Windows
A.1.2、Mac
OS
X
A.1.3、Linux
A.2、
Matplotlib
A.3、PIL
A.4、LibSVM
A.5、OpenCV
A.5.1、Windows
和
Unix
A.5.2、Mac
OS
X
A.5.3、Linux
A.6、VLFeat
A.7、PyGame
A.8、PyOpenGL
A.9、Pydot
A.10、Python-graph
A.11、Simplejson
A.12、PySQLite
A.13、CherryPy
附录
B
图像集
B.1、Flickr
B.2、Panoramio
B.3、牛津大学视觉几何组
B.4、肯塔基大学识别基准图像
B.5、其他
B.5.1、Prague
Texture
Segmentation
Datagenerator与基准
B.5.2、微软剑桥研究院Grab
Cut数据集
B.5.3、Caltech
101、B.5.4、静态手势数据库
B.5.5、Middlebury
Stereo数据集
附录
C
图片来源
C.1、来自Flickr的图像
C.2、其他图像
C.3、插图
参考文献
看完了