构建实时机器学习系统

构建实时机器学习系统

作者:彭河森汪涵

出版社:机械工业

出版年:2017年8月

ISBN:9787111575573

所属分类:网络科技

书刊介绍

《构建实时机器学习系统》内容简介

本书首先利用Pandas对美股秒级交易数据进行分析,利用Scikit-learn对股票变化方向进行预测,并在架构案例中,打造了一个以RabbitMQ为消息传导中枢的实时处理系统,利用Elasticsearch对数据进行实时可视化。
彭河森,资深机器学习科学家,曾在Google、Amazon、微软等公司从事一线机器学习架构和开发工作,参与了Google实时数据警报、Amazon产品广告自动化优化,微软必应广告等多项海量数据、延时要求苛刻的机器学习应用工作。
汪涵,资深机器学习开发者,曾是Amazon、微软、Quantlab、晨星等公司一线机器学习开发人员,参与了Amazon AB检验服务、微软必应搜索问答系统等多项关键大数据处理和机器学习应用的架构和开发工作。对机器学习、自然语言处理有着深刻的体会。

作品目录

前言
第1部分
实时机器学习方法论
第1章:实时机器学习综述
1.1、什么是机器学习
1.2、机器学习发展的前世今生
1.3、机器学习领域分类
1.4、实时是个“万灵丹”
1.5、实时机器学习的分类
1.6、实时应用对机器学习的要求
1.7、案例:Netflix在机器学习竞赛中学到的经验
1.8、实时机器学习模型的生存期
第2章:实时监督式机器学习
2.1、什么是监督式机器学习
2.2、怎样衡量监督式机器学习模型
2.3、实时线性分类器介绍
第3章:数据分析工具Pandas
3.1、颠覆R的Pandas
3.2、Pandas的安装
3.3、利用Pandas分析实时股票报价数据
3.4、数据分析的三个要点
第4章:机器学习工具Scikit-learn
4.1、如何站在风口上?向Scikit-learn学习
4.2、Scikit-learn的安装
4.3、Scikit-learn的主要模块
4.4、利用Scikit-learn进行股票价格波动预测
第2部分
实时机器学习架构
第5章:实时机器学习架构设计
5.1、设计实时机器学习架构的四个要点
5.2、Lambda架构和主要成员
5.3、常用的实时机器学习架构
5.4、小结
第6章:集群部署工具Docker
6.1、Docker的前世今生
6.2、容器虚拟机的基本组成部分
6.3、Docker引擎命令行工具
6.4、通过Dockerfile配置容器虚拟机
6.5、服务器集群配置工具Docker
Compose
6.6、远端服务器配置工具Docker
Machine
6.7、其他有潜力的Docker工具
第7章:实时消息队列和RabbitMQ
7.1、实时消息队列
7.2、AMQP和RabbitMQ简介
7.3、RabbitMQ的主要构成部分
7.4、常用交换中心模式
7.5、消息传导设计模式
7.6、利用Docker快速部署RabbitMQ
7.7、利用RabbitMQ开发队列服务
第8章:实战数据库综述
8.1、SQL与NoSQL,主流数据库分类
8.2、数据库的性能
8.3、SQL和NoSQL对比
8.4、数据库的发展趋势
8.5、MySQL简介
8.6、Cassandra简介
第9章:实时数据监控ELK集群
9.1、Elasticsearch、LogStash和Kibana的前世今生
9.2、Elasticsearch基本架构
9.3、Elasticsearch快速入门
9.4、Kibana快速入门
第10章:机器学习系统设计模式
10.1、设计模式的前世今生
10.2、读:高速键值模式
10.3、读:缓存高速查询模式
10.4、更新:异步数据库更新模式
10.5、更新:请求重定向模式
10.6、处理:硬实时并行模式
10.7、处理:分布式任务队列模式
10.8、处理:批实时处理模式
第3部分
未来展望
第11章:Serverless架构
11.1、Serverless架构的前世今生
11.2、Serverless架构对实时机器学习的影响
第12章:深度学习的风口
12.1、深度学习的前世今生
12.2、深度学习的难点
12.3、如何选择深度学习工具
12.4、未来发展方向

热门书摘

在常规计算机编程中,所有的逻辑都是人为设定的。而机器学习方法是试图让观测到的数据和现象成为编撰逻辑的依据,不同模型之间的衡量标准也试图尽量达到标准化,以使得人为干预最小化。

相关推荐

微信二维码