作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
《企业资金管理》内容简介:企业经营管理中,管理好企业资金是企业长期持续经营与发展的基础与保障。国内大多数企业的资金管理水平
《结构思考力Ⅱ》内容简介:本书是有关结构思维的,由李忠秋老师亲自执笔,结构思考力系列丛书之一。它告诉我们只要在清晰思考的基
FromCharlesM.Kozierok,thecreatorofthehighlyregardedwww.pcguide.com,comesTheTCP/I...
《“一带一路”引领国际新秩序构建:国外智库论中国与世界(之八)》内容简介:本书以“‘一带一路’引领国际新秩序构建”为主题,
《东北沿边地区开发开放战略研究》内容简介:衣保中著的《东北沿边地区开发开放战略研究/东北亚研究丛书》立足区域经济联动发展的可
《独立游戏开发》内容简介:本书第1篇适合所有想要了解独立游戏开发的读者阅读,第2、3篇则适合有一定C#或Java编程语言基础的游戏开
《无线通信与移动通信中信号处理研究的新进展》总结了近年来通信信号处理领域的最新研究成果,概括地讨论了通信信号处理中最具特
◎聯合推薦實踐大學設計學院院長/安郁茜政治大學科技管理研究所教授/李仁芳奧美廣告執行創意總監/胡湘雲設計,打造感動人心的
《透过经济看国学》内容简介:中国传统文化主要由儒、佛、道三家文化组成,如果把中国传统文化比喻成一只大鹏,那么其身体就是儒家
移动通信是当前发展最快、应用最广和最前沿的通信领域之一。本书共分为七章,主要介绍了移动通信的基本概念,移动通信网网络技术
实用数据库教程 本书特色 《实用数据库教程》是数据库的*新教程,它包括数据库原理、数据库设计模式和数据库应用,共计3篇16章。其中第2篇的第6、7、8三章为数据...
InteriordesignguruAxelVervoordtshareshislatestinspirationsforthehome.AxelVervoor...
《人人都应该知道的人工智能》内容简介:本书是斯坦福大学教授杰瑞·卡普兰继其畅销书《人工智能时代》之后的又一部重磅新作,详尽
Searchisnotjustaboxandtenbluelinks.Searchisajourney:anexplorationwherewhatweenco...
庄雅婷领衔“文艺加萌研究所”策划推出的国内第一套快乐开店指南+逛店秘笈分享。本辑“有胆有脑”主题,精选近30家国内成功店铺,
《21世纪高等院校电气信息类系列教材•人工神经网络原理及仿真实例》以神经网络结构为主线,以学习算法为副线,详细介绍了神经网络
Thisessentiallyself-contained,deliberatelycompact,anduser-friendlytextbookisdesi...
《与50位网站主编面对面》内容简介:《与50位网站主编面对面》的内容来自于国内第一网络编辑社区Bianews的“网编训练营”公益培训项
《室内分布系统规划与设计:GSM/TD-SCDMA/TD-LTE/WLAN》介绍了GSM/TD—SCDMA/WLAN/TD—LTE四网融合室内分布系统的基本原理...
新思路(2013最新版)二级Access 上机考试新版题库 无纸化考试新题型 本书特色 新思路(2013最新版)二级Access 上机考试新版题库 无纸化考试新...