数学之美-教辅教材-文化科教-太极之巅书单号

书刊介绍

内容简介

吴军博士，现任腾讯公司主管搜索、在线广告和云计算基础架构的副总裁，毕业于清华大学（本科、硕士）和美国约翰·霍普金斯大学（博士）。在清华大学和约翰·霍普金斯大学期间，吴军博士致力于语音识别、自然语言处理，特别是统计语言模型的研究。他曾获得1995年全国人机语音智能接口会议的最佳论文奖和2000年Eurospeech的最佳论文奖。

吴军博士于2002年加入Google公司。在Google，他和Amit Singhal（Google院士，世界著名搜索专家）、Matt Cutts（Google反作弊官方发言人）等三位同事一起开创了网络搜索反作弊的研究领域，并因此获得Google工程奖。2003年，他和Google全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google期间，他还领导了许多...

()

作品目录

出版说明
序言1
序言2
前言
第1章　文字和语言 vs 数字和信息
第2章　自然语言处理 — 从规则到统计
第3章　统计语言模型
第4章　谈谈中文分词
第5章　隐含马尔可夫模
第6章　信息的度量和作用
第7章　贾里尼克和现代语言处理
第8章　简单之美 — 布尔代数和搜索引擎的索引
第9章　图论和网络爬虫
第10章　PageRank — Google的民主表决式网页排名技术
第11章　如何确定网页和查询的相关性
第12章　地图和本地搜索的最基本技术 — 有限状态机和动态规划
第13章　Google AK-47的设计者 — 阿米特 · 辛格博士
第14章　余弦定理和新闻的分类
第15章　矩阵运算和文本处理中的两个分类问题
第16章　信息指纹及其应用
第17章　由电视剧《暗算》所想到的 — 谈谈密码学的数学原理
第18章　闪光的不一定是金子 — 谈谈搜索引擎反作弊问题
第19章　谈谈数学模型的重要性
第20章　不要把鸡蛋放到一个篮子里 — 谈谈最大熵模型
第21章　拼音输入法的数学原理
第22章　自然语言处理的教父马库斯和他的优秀弟子们
第23章　布隆过滤器
第24章　马尔可夫链的扩展 — 贝叶斯网络
第25章　条件随机场和句法分析
第26章　维特比和他的维特比算法
第27章　再谈文本自动分类问题 — 期望最大化算法
第28章　逻辑回归和搜索广告
第29章　各个击破算法和Google云计算的基础
附录
后记
索引
· · · · · ·

作者简介

(展开全部)

精彩摘录

虽然做事认真的犹太人要求在抄写《圣经》时，要虔诚并且打起十二分精神，尤其是每写到“上帝”（God和Lord）这个词时要去洗手祈祷，不过抄写错误还是难以避免。于是犹太人发明了一种类似于我们今天计算机和通信中校验码的方法。他们把每一个希伯来字母对应一个数字，这样每行文字加起来便得到一个特殊的数字，这个数字便成为了这一行的校验码。同样，对于每一列也是这样处理。当犹太学者抄完一页《圣经》时，他们需要把每一行的文字加起来，看看新的校验码是否和原文的相同，然后对每一页进行同样的处理。如果这一页每一行每一列的校验码都和原文完全相同，说明这一页抄写无误。

——引自第12页

1.一个正确的数学模型应当在形式上是简单的.2.一个正确的模型一开始可能还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去.3.大量准确的数据对研发很重要.4.正确的模型也可能受噪音干扰,而显得不准确;这时不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大的发现.

——引自第175页