作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
计算机:一部历史 本书特色 《计算机——一部历史》(彼得·本特利著), 给大众读者写的计算机科普读物,零门槛入门计算机 科学。讲述计算机背后鲜为人知的故事,普及...
《胡须爷爷讲《论语》》内容简介:丫丫是一个可爱的8岁女孩,她喜欢新奇有趣的事物,但面对艰辛的学习,存在畏难情绪。在生日会上,
《汽车发动机故障维修实训教程》内容简介:本书共分三项任务,由检修发动机不能起动故障、检修发动机运转不良故障及检修冷却液温度
《高等学校教材•通信电子电路》主要讨论用于各种无线电技术设备和系统中的通信电子电路,包括噪声与干扰、高频放大电路、正弦波振
GooglebuilttheGolanguagefromthegrounduptosimplifythechallengesofmodernapplicatio...
《工业互联网推动中小企业包容性增长的内在逻辑》内容简介:本书紧扣“把握构建新发展格局的时代使命,立足中小企业生力军主体,依
《斜杠思维:如何打造独特而强大的自品牌》内容简介:移动互联网时代,自品牌的塑造已经成为一个人生存与发展的王道。这本书跨界职
《世界经典火炮TOP10》内容简介:火炮是陆军武器的重要组成部分和主要火力突击力量。本书以火炮发展的重要节点划分历史时期,纵向回
《爱烘焙会拍照:速成烘焙大师攻略》内容简介:新浪美食博客首页推荐、百万博主马琳的第四本《马琳的点心书》来啦! 独家配方,操作
《自适应学习:人工智能时代的教育革命》内容简介:本书以浅显生动的语言讲述最前沿的理念——人工智能与自适应学习将如何改变教育
Theclassic,landmarkworkonsoftwaretestingThehardwareandsoftwareofcomputinghavecha...
软件测试技术经典教程 本书特色 本书是高级软件测试工程师专用教材。作者通过丰富的项目及培训经验,结合大量实际案例讲解软件测试技术和软件测试工具的应用,将*实用的...
本书是日本著名生活家居品牌无印良品推出的“无印良品的生活方式”系列概念书之一。本书的关键词为“要素”——一个围绕居家生活
《零基础学Oracle》内容简介:Oracle数据库是目前世界上使用最为广泛的数据库管理系统。本书不仅是一本Oracle的入门教材,也是初学
《Struts2技术内幕:深入解析Struts架构设计与实现原理》内容简介:《Struts2技术内幕:深入解析Struts2架构设计与实现原理》由国内
《一步一步学Spring Boot 2:微服务项目实战》内容简介:本书以项目实战为主体,循序渐进地介绍了Spring Boot 2.0在Web应用开发方面
《桂海论痕》内容简介:本书主要研究广西当代作家、作品。作者用颇具才情的笔墨,为读者勾勒了一幅广西当代文坛地图,脉络清晰,文
《独立董事制度的理论与实践》内容简介:独立董事制度在我国的发展逐渐成熟,其相关规则也日益完善。在这样的大背景下,独立董事制
Machinelearningallowscomputationalsystemstoadaptivelyimprovetheirperformancewith...
YoramOrzach毕业于色列技术学院(IsraelInstituteofTechnology),持有该校科学学士学位。1991-1995年,以系统工程师的身...