作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
《上海科技人才发展研究报告(2020)》内容简介:本书综合运用前瞻研究、政策分析、问卷调查、比较研究等理论方法,力图科学研判科
书是讲述下一代编程语言Erlang的权威著作,主要涵盖顺序型编程、异常处理、编译和运行代码、并发编程、并发编程中的错误处理、分
《绽放:第二十一届新概念作文获奖者作品精选. A卷》内容简介:本书精选2019年第21届全国新概念作文大赛一、二等奖获奖者的作品,结
《微课:快学、快用、快设计》内容简介:本书作者基于其微课开发的实践和对海量案例的研究,提供了一套有效的微课设计方法、展示了
《Vue.js应用测试》内容简介:Vue.js创始人尤雨溪(Evan You)鼎力推荐!Vue官方测试工具作者亲笔撰写。本书是一本为Vue应用程序开
《聂卫平围棋习题精解·手筋专项训练(从3段到5段)》内容简介:本书是我国围棋职业运动员聂卫平同聂卫平围棋道场的明星教师团队联
当今社会技术体系面临变革,巨大的社会需求和挑战不断涌现,毫不夸张地说,这是一个人人参与设计的时代。在此背景下,无论是设计
高性能通信网络(原书第2版),ISBN:9787111094456,作者:(美)JeanWalrand,(美)PravinVaraiya著;张艳等译目录 出版者...
《第一行代码——Android》是Android初学者的最佳入门书。全书由浅入深、系统全面地讲解了Android软件开发的方方面面。第1章带领
Verilog HDL数字集成电路设计原理与应用 内容简介 本书系统地对Verilog HDL语法和程序设计进行了介绍,明确了数字可综合逻辑设计和测试仿真程序设...
Android开发从入门到精通-项目案例版 本书特色 《Android开发从入门到精通(项目案例版)》作为Android书籍,从1行代码开始,详尽讲述了Andr...
《合家欢的超萌简笔画》内容简介:《合家欢的超萌简笔画》大量运用最简单的几何体,画风软萌,以详解案例步骤为主;从单个几何体的
《传承:一种关系及其隐秘动力》内容简介:传承的N个实用指南:无论你是传承精神,传承财富,还是家风,你都需要这样一本书。它会告
张量数据的特征提取与分类 本书特色 《张量数据的特征提取与分类》的主要研究内容是在模式识别应用领域中,提出新的基于张量数据的特征提取和分类算法,并且对这些张量型...
从编程技术到项目管理,RoySingham、MartinFowler、RebeccaParsons等来自ThoughtWorks的思想领袖通过本书中的13篇美文...
《你不知道的JavaScript(上卷)》内容简介:JavaScript语言有很多复杂的概念,但却用简单的方式体现出来(比如回调函数),因此,
Inprehistory,earlyhumanscreatedthefirstinformationgraphics:cavepaintings,laterma...
Excel 2010图表实战技巧精粹-(附光盘) 本书特色 卓越图表应当具备3个重要的要素:真实、简明、丰富。 真实:图表所表达的观点和传递的信息必须真实、准确...
Thebook,writteninthestyleofTheLittleSchemer,introducesinstructors,students,andpr...
《IT传:信息技术250年》内容简介:网络普及以后,我们的生活和商业方式都发生了戏剧性的变化。如果只徒然地追求这些变化的话,是看