《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
Preface
1.Language Processing and Python
1.1 Computing with Language: Texts and Words
1.2 A Closer Look at Python: Texts as Lists of Words
1.3 Computing with Language: Simple Statistics
1.4 Back to Python: Making Decisions and Taking Control
1.5 Automatic Natural Language Understanding
1.6 Summary
1.7 Further Reading
1.8 Exercises
2.Accessing Text Corpora and Lexical Resources
2.1 Accessing Text Corpora
2.2 Conditional Frequency Distributions
2.3 More Python: Reusing Code
2.4 Lexical Resources
2.5 WordNet
2.6 Summary
2.7 Further Reading
2.8 Exercises
3.Processing Raw Text
3.1 Accessing Text from the Web and from Disk
3.2 Strings: Text Processing at the Lowest Level
3.3 Text Processing with Unicode
3.4 Regular Expressions for Detecting Word Patterns
3.5 Useful Applications of Regular Expressions
3.6 Normalizing Text
3.7 Regular Expressions for Tokenizing Text
3.8 Segmentation
3.9 Formatting: From Lists to Strings
3.10 Summary
3.11 Further Reading
3.12 Exercises
4.Writing Structured Programs
4.1 Back to the Basics
4.2 Sequences
4.3 Questions of Style
4.4 Functions: The Foundation of Structured Programming
4.5 Doing More with Functions
4.6 Program Development
4.7 Algorithm Design
4.8 A Sample of Python Libraries
4.9 Summary
4.10 Further Reading
4.11 Exercises
5.Categorizing andTagging Words
5.1 Using a Tagger
5.2 Tagged Corpora
5.3 Mapping Words to Properties Using Python Dictionaries
5.4 Automatic Tagging
5.5 N-Gram Tagging
5.6 Transformation-Based Tagging
5.7 How to Determine the Category of a Word
5.8 Summary
5.9 Further Reading
5.10 Exercises
6.Learning to Classify Text
6.1 Supervised Classification
6.2 Further Examples of Supervised Classification
6.3 Evaluation
6.4 Decision Trees
6.5 Naive Bayes Classifiers
6.6 Maximum Entropy Classifiers
6.7 Modeling Linguistic Patterns
6.8 Summary
6.9 Further Reading
6.10 Exercises
7.Extracting Information from Text
7.1 Information Extraction
7.2 Chunking
7.3 Developing and Evaluating Chunkers
7.4 Recursion in Linguistic Structure
7.5 Named Entity Recognition
7.6 Relation Extraction
7.7 Summary
7.8 Further Reading
7.9 Exercises
8.Analyzing Sentence Structure
8.1 Some Grammatical Dilemmas
8.2 Whats the Use of Syntax?
8.3 Context-Free Grammar
8.4 Parsing with Context-Free Grammar
8.5 Dependencies and Dependency Grammar
8.6 Grammar Development
8.7 Summary
8.8 Further Reading
8.9 Exercises
9.Building Feature-Based Grammars
9.1 Grammatical Features
9.2 Processing Feature Structures
9.3 Extending a Feature-Based Grammar
9.4 Summary
9.5 Further Reading
9.6 Exercises
10.Analyzing the Meaning of Sentences
10.1 Natural Language Understanding
10.2 Propositional Logic
10.3 First-Order Logic
10.4 The Semantics of English Sentences
10.5 Discourse Semantics
10.6 Summary
10.7 Further Reading
10.8 Exercises
11.Managing Linguistic Data
11.1 Corpus Structure: A Case Study
11.2 The Life Cycle of a Corpus
11.3 Acquiring Data
11.4 Working with XML
11.5 Working with Toolbox Data
11.6 Describing Language Resources Using OLAC Metadata
11.7 Summary
11.8 Further Reading
11.9 Exercises
Afterword: The Language Challenge
Bibliography
NLTK Index
General Index
多媒体应用技术 内容简介 本书从多媒体的构成要素入手,全面系统地介绍了各种素材的采集、编辑和应用,主要介绍了当前比较流行的多媒体应用软件,如C00L 3D、 P...
《聪明女人的口才修炼课》内容简介:在人际关系互动频繁的时代,说话技巧变得愈来愈重要。女人想要拥有好人缘,在职场和情场里无往
Thisbookisaboutimplementations,notlanguages,itwillmakenoattempttoextolthevirtues...
《遇见台湾·古早的味道》内容简介:《遇见台湾:古早的味道》是一本传统台湾美食文化的书。“古早”在闽南语中意为“过去、曾经”
小天才学Python 本书特色 这是一本专门给小学生和中学生学习的编程书。编程对于培养孩子的逻辑思维能力和动手能力至关重要,国家正在推动将编程纳入到中小学教学和...
《我读:陪你读到世界尽头》内容简介:《我读:陪你读到世界尽头》是由梁文道主讲的书评集。用最简洁直白的方式带领读者领略好书的
《因为喜欢,可迎万难:张爱玲传》内容简介:张爱玲,理解生活的深刻,动荡的人生染着轻盈的落寞,是一个可以与世界“顶级”小说家
《微信营销36计》内容简介:这是一本介绍微信营销技巧的书。在《微信营销36计:你不可不知的赚钱、赢粉丝技巧 》书中我们微信给力的
多维信号处理:快速变换.稀疏表示与低秩分析 本书特色 多数信号处理论著主要针对理论与方法臻备的一维信号,而对于仍在发展完善中的多维信号处理少有涉及或涉之不深。本...
《Linux高级程序设计》是Linux程序设计领域的一部力作,讲解了大量程序员需要掌握的关键知识点,包括Linux开发中的基本工具、Lin
《肌肉训练实战宝典》内容简介:《肌肉训练实战宝典》是专为期望快速训练肌肉的读者所设计的入门级图书。通过专业教练的详细演示,
本书全面而系统地介绍了安藤忠雄的作品,包括他从成名以来到现在的一些代表作以及他最新的一些作品。书中所用的图纸和资料都由安藤
《中国为什么有前途(第3版)》内容简介:如果你只对国家经济手段的战略运用感兴趣,可以直接阅读本书各章的后半部分,因为那里探讨
《信息系统项目管理师考试试题分类精解(第5版)》内容简介:本书由希赛教育软考学院组织编写,作为计算机技术与软件专业技术资格(
《当戈壁遇见长江》内容简介:戈壁挑战赛是中国企业家的练兵场,是对个人意志、体能素质、战略战术和团队协作等方面的综合考验。在
《中医的常识》内容简介:★学习中医的收获:在目前的生活状态下做贵人 ★普通人如何学习中医——有自知之明、自觉之感,方有慧心之
《图灵的大教堂》内容简介:1936年,时年24岁的图灵宣称:“发明一台可用于计算任意可计算序列的单一机器是有可能的。”在《图灵的
《我和LabVIEW:一个NI工程师的十年编程经验》是作者在学习和使用LabVIEW过程中的经验总结。书中由浅入深地对LabVIEW最常用的功能
DAMNGOODADVICE(forpeoplewithtalent!)isalookintothemindofoneofAmericasmostlegenda...
《吸引法则》内容简介:掌握吸引力法则是创造梦想人生的关键,想获得优质的人脉,需要先把自己活成一个优质的存在,一个吸引别人的