作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
《ANSYS 18.0有限元分析从入门到精通(升级版)》内容简介:本书采用GUI界面操作与APDL命令相互对照的方式,从基础知识、专题技术两
可信计算技术原理与应用 本书特色 在本书中可信计算是指系统提供的计算行为能够满足需求者对计算的期望,并且系统具有能够证明其计算可信性的能力。综合来看,可信计算平...
《不变与万变:葛剑雄说国史》内容简介:复旦大学资深教授葛剑雄讲述中国历史的血脉精神,在兴衰、传承与变迁中,寻找中国历史的源
《网上遗产》内容简介:你担心自己死后,社交网络账号被家人登录吗? “集体点蜡”真的有意义吗? 我们今天的“晒娃”,孩子若干年
Thisessentiallyself-contained,deliberatelycompact,anduser-friendlytextbookisdesi...
《Node.js》内容简介:Node.js作为近几年新兴的一种编程运行时,托V8引擎的福,在作为后端服务时有比较高的运行效率,在很多场景下
主要撰稿人克里斯・杰弗莉(ChrisJefferys)是《服装缝制图解大全》一书的主要撰稿人和组织者。多年从事缝纫和刺绣教学,后成为《
嵌入式Linux系统开发全程解析 本书特色 《嵌入式linux系统开发全程解析》是一本全面介绍嵌入式linux开发的专著,书中涵盖了程序生成工具、调试工具、引导...
本教材以力学理论和控制理论的全面讲述为特色。教材的重点在于用严谨而系统的方式介绍机器人动力学与控制的基本概念和主要结果。
《记者的发现力(增订本)》内容简介:“发现”是一种力量。记者善于发现新鲜事物、揭示事物内在规律的能力就是“新闻发现力”。本
《图灵的大教堂》内容简介:1936年,时年24岁的图灵宣称:“发明一台可用于计算任意可计算序列的单一机器是有可能的。”在《图灵的
《Mentor高速电路板设计与仿真》以MentorEE2005SP3为基础,以具体电路为范例,详尽讲解元器件建库、原理图设计、布局、布线、仿真
《计算机组织与体系结构:性能设计》(第7版)是介绍当代计算机体系主流技术的最新技术的优秀教材。作者以IntelPentium4和IBM/Motor
零基础学Word 本书特色 《计算机实用技能丛书》是一套软件专业类丛书,该丛书采用图解教学,针对当前*新软件,由浅入深地进行了详尽讲解。内容全面、简单直观、通俗...
《吾心可鉴:跨文化沟通》内容简介:不同的文化在语言、习俗、文化心理等方面都有巨大的差异。本书从文化和心理学的双重视角,分全
《逍遥游(绘本版)》内容简介:《逍遥游》是战国时期哲学家、文学家庄子的代表作,无论在艺术上还是思想上均可视为《庄子》一书的
《法律硕士联考专业基础课经典案例分析》内容简介:本书是法律硕士联考案例分析题的专项训练,含基本案例和复杂案例两部分,各部分
《大明帝国》内容简介:本书是一部以《明史》为基础的历史小说,分为上、下两册。全面展现了大明帝国开国后波云诡谲、血雨腥风的历
《猫派》内容简介:◆十二则刊载于《纽约客》杂志的“现象级”短篇小说 ◆网络上超三百万人次转发,HBO即将改编影视 ◆人的情感,真
《会吃的孩子更健康》内容简介:食商,即饮食商数,类似于我们常说的智商、情商、艺商等概念。如今,人们对于饮食的追求不再仅仅是