作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
这是一本极其实用的设计训练书。本书内容包括使用基本图形的平面构图训练、使用色彩的平面构图训练、构图实战训练等。书中为读者
KEYBENEFIT:Providesabroadsurveyofdesigning,implementing,managing,maintaining,tra...
情感计算与情感机器人系统 本书特色 《情感计算与情感机器人系统》在介绍情感计算、情感建模以及人机情感交互概念的基础上,分析了当前人机情感交互的研究前沿,总结了在...
《C语言学习指南:从规范编程到专业级开发》内容简介:本书分为五部分,通过大量简明易懂的范例由浅入深地演示C语言中的概念和编程
《生命的战争》内容简介:最早的那批可以自我复制并且随机突变的复杂有机分子,经历了怎样的发展,才最终造就了如今这个多姿多彩的
软件功能测试基于Quick Test Professional应用 本书特色 《软件功能测试--基于QuickTest Professional应用》由李晓鹏、...
《太极拳延缓认知衰退研究:基于脑科学》内容简介:本书旨在揭示太极拳锻炼对改善老年人认知功能的影响及其作用机制。全书内容分三
《Node与Express开发》内容简介:本书系统讲解了使用Express开发动态Web应用的流程和步骤。作者不仅讲授了开发公共站点及REST API的
图像序列运动分析技术与应用 本书特色 本书较为全面地介绍了图像序列运动分析中光流与场景流计算的有关原理和技术方法,并探讨了相关应用。主要内容包括变分光流计算技术...
《商业摄影核心课》内容简介:这是一本从基础入门技术出发,直指专业高度,揭示商业服装摄影专业技法的实用教材。本书从具体的拍摄
《室内分布系统规划与设计:GSM/TD-SCDMA/TD-LTE/WLAN》介绍了GSM/TD—SCDMA/WLAN/TD—LTE四网融合室内分布系统的基本原理...
本书将最有用的CSS技术汇总在一起,在介绍基本的CSS概念和最佳实践之后,讨论了核心的CSS技术,例如图像、链接、列表操纵、表单设
《GDI+图形程序设计》GDI+是新一代的图形接口。如果要设计.NETFramework图形应用程序,就必须使用GDI+。《GDI+图形程序设计》是一
如今的网站和内联网已经变得比以前越来越大,越来越有价值,而且越来越复杂,同时其用户也变得更忙,也更加不能容忍错误的发生。
用户故事与敏捷方法 本书特色 《用户故事与敏捷方法》:敏捷大师Mike Cohn的软件需求方法圣经,小型团队(项目)不可或缺的敏捷开发宝典,亚马逊五星级长销图书...
《“资本一般”与政治经济学批判》内容简介:在熟悉全部文献的写作过程和内容的基础上,本书找到一个恰当的解读框架——“资本一般
全国英语等级考试词汇必备第二级 本书特色 针对教育部*新颁布的《全国英语等级考试大纲(全新版)》,未来教育在已出版成功的词汇书的基础上,对《全国英语等级考试词汇...
DiscoverallthesecurityrisksandexploitsthatcanthreateniOS-basedmobiledevicesiOSis...
《单兵作战装备图鉴(白金版)》内容简介:本系列丛书精心选取世界各国单兵装备的近百种经典枪械、爆破武器、冷兵器等,从每种武器
《锋利的SQL》内容简介:本书从基础、开发、性能调整和实战4方面介绍了SQL技术及其应用,包括数据库与架构、表管理、索引管理、基本