大规模分布式系统架构与设计实战

大规模分布式系统架构与设计实战

作者:彭渊

出版社:机械工业

出版年:2014年2月

ISBN:9787111455035

所属分类:科普读物

书刊介绍

《大规模分布式系统架构与设计实战》内容简介

本书从作者的实战经验出发,深入浅出地讲解了如何建立一个Hadoop那样的分布式系统,实现对多台计算机CPU、内存、硬盘的统一利用,从而获取强大计算能力去解决复杂问题。一般互联网企业的分布式存储计算系统都是个大平台,系统复杂、代码庞大,而且只适合公司的业务,工程师很难下载安装到自己的电脑里学习和吃透。本书对分布式核心技术进行了大量归纳和总结,并从中抽取出一套简化的框架和编程API进行讲解,方便工程师了解分布式系统的主要技术实现。这不是一本空谈概念、四处摘抄的书,这本书包含了大量精炼示例,手把手教你掌握分布式核心技术。
本书主要内容  分布式并行计算的基本原理解剖;  分布式协调的实现,包括如何实现公共配置管理,如何实现分布式锁,如何实现集群管理等;  分布式缓存的实现,包括如何提供完整的分布式缓存来利用多机内存能力;  消息队列的实现,包括如何实现发送和接收模式;  分布式文件系统的实现,包括如何像操作本地文件一样操作远程文件,并利用多机硬盘存储能力;  分布式作业调度平台的实现,包括资源隔离、资源调度等。
【参考阅读】 978-7-111-43052-0 大规模分布式存储系统:原理解析与架构实战 978-7-111-40392-0 分布式系统:概念与设计(原书第5版) 978-7-111-45244-7 Hadoop应用开发技术详解 978-7-111-41766-8 Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理 978-7-111-42226-6 Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 978-7-111-44534-0 Hadoop技术内幕:深入解析YARN架构设计与实现原理 978-7-111-43514-3 网站数据分析:数据驱动的网站管理、优化和运营 978-7-111-42591-5 数据挖掘:实用案例分析 彭渊 资深架构师,现任华为企业中间件首席架构师,主要负责中间件和大数据。前淘宝高级专家(花名:千峰),先后在淘宝交易、淘宝中间件、集团核心系统、阿里金融等部门工作。曾任金蝶总体架构部SOA架构师,负责设计ESB。曾艰苦创业,编写和销售财务软件。在Java技术领域从业十多年,撰写过多款开源软件,其中,淘宝分布式技术框架Fourinone为其代表作。他拥有软件著作权的代表作有:BS系列软件(包括财务进销存、OA产品、CRM等)、FMS视频会议、Flash网站生成软件(华军可下载),所有软件作品均贡献99%代码。

作品目录

大规模分布式系统架构与设计实战
前言
第1章:概述
1.1、分布式计算、并行计算、云计算概述
1.什么是分布式计算
2.什么是并行计算
3.并行计算与串行计算的关系
4.什么是云计算
1.2、分布式产品Hadoop、ZooKeeper、HBase概述
1.Hadoop
2.ZooKeeper
3.HBase
1.3、Fourinone的产生背景
1.使用Hadoop时碰到的问题
2.抽取一个简化的并行计算框架
第2章:分布式并行计算的原理与实践
2.1、分布式并行计算模式
2.1.1、最初想到的master-slave结构
2.1.2、“包工头-职介所-手工仓库-工人”模式
2.1.3、基于消息中枢的计算模式
2.1.4、基于网状直接交互的计算模式
2.1.5、并行结合串行模式
2.1.6、包工头内部批量多阶段处理模式
2.1.7、计算集群模式和兼容遗留计算系统
2.1.8、工人计算的服务化模式
2.2、跟Hadoop的区别
2.3、关于分布式的一些概念与产品
1.Storm
2.Spark
3.MPI
4.BSP
5.DAG
2.4、配置文件和核心API介绍
2.5、实践与应用
2.5.1、一个简单的示例
2.5.2、工头工人计算模式更完整的示例
2.5.3、工人合并互相say
hello的示例
2.5.4、实现Hadoop经典实例Word
Count
2.5.5、分布式多机部署的示例
2.5.6、分布式计算自动部署的示例
2.5.7、计算过程中的故障和容灾处理
2.5.8、计算过程中的相关时间属性设置
2.5.9、如何在一台计算机上一次性启动多个进程
1.如何串行或并行的启动进程
2.如何杀死进程和超时杀死进程
3.如何输出进程运行的日志信息
2.5.10、如何调用C/C++程序实现
2.5.11、如何中止工人计算和超时中止
2.5.12、使用并行计算大幅提升递归算法效率
1.单机解决方案
2.分布式并行计算解决方案
2.5.13、使用并行计算求圆周率π
2.5.14、从赌钱游戏看PageRank算法
2.5.15、使用并行计算实现上亿排序
1.为什么需要并行计算来排序
2.数据取值范围
3.输入输出数据
4.并行计算排序的详细过程
2.5.16、工人服务化模式应用示例
2.6、实时流计算
第3章:分布式协调的实现
3.1、协调架构原理简介
3.2、核心API
1.创建node
2.创建心跳属性节点
3.获取node
4.获取最新node,需要传入旧node进行对照
5.添加node的事件监听
3.3、权限机制
3.4、相对于ZooKeeper的区别
3.5、与Paxos算法的区别
3.6、实践与应用
3.6.1、如何实现公共配置管理
3.6.2、如何实现分布式锁
3.6.3、如何实现集群管理
3.6.4、多节点权限操作示例
3.6.5、领导者选举相关属性设置
第4章:分布式缓存的实现
4.1、小型网站或企业应用的缓存实现架构
4.2、大型分布式缓存系统实现过程
4.3、一致性哈希算法的原理、改进和实现
1.数据服务器发生故障的时候
2.集群服务器扩容的时候
3.集群服务器分布不均的时候
4.一致性哈希算法的改进
4.4、解决任意扩容的问题
4.5、解决扩容后数据均匀的问题
4.6、分布式Session的架构设计和实现
4.7、缓存容量的相关属性设置
4.8、缓存清空的相关属性设置
第5章:消息队列的实现
5.1、闲话中间件与MQ
5.2、JMS的两种经典模式
5.3、如何实现发送接收的队列模式
5.4、如何实现主题订阅模式
第6章:分布式文件系统的实现
6.1、FTTP架构原理解析
6.2、搭建配置FttpAdapter环境
6.3、访问集群文件根目录
6.4、访问和操作远程文件
6.5、集群内文件复制和并行复制
6.6、读写远程文件
6.7、解析远程文件
6.8、并行读写远程文件
6.9、批量并行读写远程文件和事务补偿处理
1.批量并行读
2.批量并行写
3.批量并行读写
4.事务补偿处理
6.10、如何进行整型读写
6.11、基于整型读写的上亿排序
第7章:分布式作业调度平台的实现
7.1、调度平台的设计与实现
7.2、资源隔离的实现
7.3、资源调度算法
7.4、其他作业调度平台简介
7.4.1、其他MPI作业资源调度技术
7.4.2、Mesos和Yarn简介
1.Mesos介绍
2.Yarn介绍

相关推荐

微信二维码