《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
Preface
1.Language Processing and Python
1.1 Computing with Language: Texts and Words
1.2 A Closer Look at Python: Texts as Lists of Words
1.3 Computing with Language: Simple Statistics
1.4 Back to Python: Making Decisions and Taking Control
1.5 Automatic Natural Language Understanding
1.6 Summary
1.7 Further Reading
1.8 Exercises
2.Accessing Text Corpora and Lexical Resources
2.1 Accessing Text Corpora
2.2 Conditional Frequency Distributions
2.3 More Python: Reusing Code
2.4 Lexical Resources
2.5 WordNet
2.6 Summary
2.7 Further Reading
2.8 Exercises
3.Processing Raw Text
3.1 Accessing Text from the Web and from Disk
3.2 Strings: Text Processing at the Lowest Level
3.3 Text Processing with Unicode
3.4 Regular Expressions for Detecting Word Patterns
3.5 Useful Applications of Regular Expressions
3.6 Normalizing Text
3.7 Regular Expressions for Tokenizing Text
3.8 Segmentation
3.9 Formatting: From Lists to Strings
3.10 Summary
3.11 Further Reading
3.12 Exercises
4.Writing Structured Programs
4.1 Back to the Basics
4.2 Sequences
4.3 Questions of Style
4.4 Functions: The Foundation of Structured Programming
4.5 Doing More with Functions
4.6 Program Development
4.7 Algorithm Design
4.8 A Sample of Python Libraries
4.9 Summary
4.10 Further Reading
4.11 Exercises
5.Categorizing andTagging Words
5.1 Using a Tagger
5.2 Tagged Corpora
5.3 Mapping Words to Properties Using Python Dictionaries
5.4 Automatic Tagging
5.5 N-Gram Tagging
5.6 Transformation-Based Tagging
5.7 How to Determine the Category of a Word
5.8 Summary
5.9 Further Reading
5.10 Exercises
6.Learning to Classify Text
6.1 Supervised Classification
6.2 Further Examples of Supervised Classification
6.3 Evaluation
6.4 Decision Trees
6.5 Naive Bayes Classifiers
6.6 Maximum Entropy Classifiers
6.7 Modeling Linguistic Patterns
6.8 Summary
6.9 Further Reading
6.10 Exercises
7.Extracting Information from Text
7.1 Information Extraction
7.2 Chunking
7.3 Developing and Evaluating Chunkers
7.4 Recursion in Linguistic Structure
7.5 Named Entity Recognition
7.6 Relation Extraction
7.7 Summary
7.8 Further Reading
7.9 Exercises
8.Analyzing Sentence Structure
8.1 Some Grammatical Dilemmas
8.2 Whats the Use of Syntax?
8.3 Context-Free Grammar
8.4 Parsing with Context-Free Grammar
8.5 Dependencies and Dependency Grammar
8.6 Grammar Development
8.7 Summary
8.8 Further Reading
8.9 Exercises
9.Building Feature-Based Grammars
9.1 Grammatical Features
9.2 Processing Feature Structures
9.3 Extending a Feature-Based Grammar
9.4 Summary
9.5 Further Reading
9.6 Exercises
10.Analyzing the Meaning of Sentences
10.1 Natural Language Understanding
10.2 Propositional Logic
10.3 First-Order Logic
10.4 The Semantics of English Sentences
10.5 Discourse Semantics
10.6 Summary
10.7 Further Reading
10.8 Exercises
11.Managing Linguistic Data
11.1 Corpus Structure: A Case Study
11.2 The Life Cycle of a Corpus
11.3 Acquiring Data
11.4 Working with XML
11.5 Working with Toolbox Data
11.6 Describing Language Resources Using OLAC Metadata
11.7 Summary
11.8 Further Reading
11.9 Exercises
Afterword: The Language Challenge
Bibliography
NLTK Index
General Index
《经学通论》内容简介:《经学通论》是清代经学大师皮锡瑞的代表作。皮氏娴于汉、宋家法,故举凡古、今宗派,以至清代诸家,皆能考
《西湖梦寻注评》内容简介:《西湖梦寻》记杭州历史掌故、绘西湖风俗画卷,是晚明小品圣手张岱代表作之一。本书作者对张岱《西湖梦
《有一种境界叫苏东坡·3》内容简介:《有一种境界叫苏东坡·3》主要讲述了中、老年时期的苏东坡在政治、文学上的成就及其情感生活
《基础会计(第二版)》内容简介:本教材结合会计从业资格考试要求,以会计基本理论、核算方法为依托,以会计实务核心技能为主线,
《网络游戏场景设计与制作实战》内容简介:本书是一本系统讲解3D网络游戏场景制作的专业教材。内容上主要分为概论、软件基础操作和
《网络空间测绘技术与实践:让互联网情报服务于网络安全》内容简介:这是一本对网络空间测绘技术原理、工具使用、最佳实践进行全面
《砖瓦》内容简介:中国古代建筑采用木结构体系,一座房屋的木构架完成后,在屋面上用瓦铺顶,在立柱之间用砖砌墙,从而围合成可使
信息可视化致力于创建那些以直观方式传达抽抽象信息的手段和方法。可视化的表达形式与交互技术则是利用人类眼睛通往心灵深处的广
这是一本为网页设计师量身定制的配色方案专业书籍。全书共分七个部分,分别结合丰富的实例讲述了配色基础知识、色相和色调(Hue&
《自动网络管理系统》对自动网络管理进行了全面介绍,全书包括三个部分。第一部分对网络管理的问题进行定义,并给出重要的背景知
《LabVIEW大学实用教程(第3版)》主要内容:LabVIEW是一种图形化编程语言,广泛用于仿真、数据采集、仪器控制、测量分析和数据显示
ThissecondeditionofGruneandJacobsbrilliantworkpresentsnewdevelopmentsanddiscover...
计算机便携化是未来的发展趋势,而Android作为最受欢迎的手机、平板电脑操作之一,其发展的上升势头是势不可当的。而Android应用
是的,你可以用Ajax开发企业级应用!随着Web逐渐成为主流计算平台,越来越多关键任务应用开始采用Ajax技术构造。但是,挑战也是巨
《温故(二十五)》内容简介:2013年推出的第二辑《温故》, “影像”专栏刊出秦风老照片馆提供的图片共30幅,反映的时代集中在上世
《颜真卿行书三稿》内容简介:颜真卿行草书对后世影响之大,几乎能与”二王”比肩。将篆隶笔法应用于行草,颜真卿于二王潇散简远、
一日你逛進某間生活道具店,喜歡上它挑選與擺設的品味,更因店主豐富的知識與真心推薦而更深入認識這個世界,再也不必費心尋覓,
本书介绍了CATIAV5CAD部分的主要模块,分6章依次介绍CATIAV5的操作入门、草图设计、零件设计、曲面造型、装配设计和工程绘图。本
《Android4游戏编程入门经典》囊括了成为一名成功的Android游戏开发者所需的全部知识。本书是一本可以信赖的指南,能够帮助你在移
《C语言名题精选百则》(技巧篇)收集了100则C语言程序设计题,共分9类。第一类比较简单,主要希望读者了解到《C语言名题精选百则》