大数据与机器学习

大数据与机器学习

作者:陈春宝阙子扬钟飞 编著

出版社:机械工业

出版年:2017年2月

ISBN:9787111556800

所属分类:成功励志

书刊介绍

《大数据与机器学习》内容简介

本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第1~3章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第4~11章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第12~15章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据“自动”流转于各个环节。
陈春宝,先后获得了经济学硕士和工业工程博士学位,拥有10年数据分析及应用经验,目前任职于股份制商业银行总行,在数据挖掘、机器学习和业务咨询方面有着独到的见解,他的工作跨大数据、营销、风险、运营等多个领域,擅长诊断各类业务问题,应用商业和数据分析手段获得创新性的解决方案,并帮助业务部门有效的实施。
他曾经担任交通银行信用卡中心的数据分析经理,以及美国MSA公司咨询顾问,拥有银行、信用卡、烟草、医药与电信等行业几十个项目的数据挖掘分析与SAS建模经验。基于大数据构建的预测模型,创新了商业模式并为公司带来新的收入来源,参与设计的算法获得人民银行科技发展二等奖。
他还长期负责企业内的数据分析人员培训和管理,并先后担任两个大数据专业期刊的责任编辑,近几年经常作为嘉宾活跃在高校与企业的一系列大数据活动中。曾担任上海交通大学工程硕士企业导师,SCI&EI索引期刊发表论文10余篇。

作品目录

前言
第一部分
数据与平台篇
第1章:数据与数据平台
1.1、数据的基本形态
1.2、数据平台
1.3、应用系统
1.4、本章小结
第2章:数据体系
2.1、数据闭环
2.2、数据缓冲区
2.3、ETL
2.4、作业调度
2.5、监控和预警
2.6、本章小结
第3章:实战:打造数据闭环
3.1、数据缓冲区的基本规则
3.2、自动加载的流程
3.3、自动加载程序的数据库设计
3.4、自动加载程序的多线程实现
3.5、本章小结
第二部分
分析篇
第4章:数据预处理
4.1、数据表的预处理
4.2、变量的预处理
4.3、变量的设计
4.4、变量筛选
4.5、本章小结
第5章:聚类,简单易用的客户细分方法
5.1、从客户细分说起
5.2、谱系聚类
5.3、K-means算法
5.4、本章小结
第6章:关联规则挖掘,发现产品加载和交叉销售机会
6.1、销售的真谛:让客户买得更多
6.2、交叉销售
6.3、关联规则挖掘,发现交叉销售机会
6.4、案例:信用卡产品交叉销售
6.5、本章小结
第7章:社交网络分析,从“关系”的角度分析问题
7.1、先看几张美轮美奂的图片
7.2、社交网络分析方法
7.3、案例:电商通过订单数据识别供应链
7.4、案例:P2P投资风险防范
7.5、本章小结
第8章:线性回归,预测客户价值
8.1、数值预测
8.2、回归与拟合
8.3、案例:信用卡客户价值预测
8.4、基于客户价值分层的业务策略
8.5、本章小结
第9章:Logistic回归,精准营销的主要支撑算法
9.1、大数据时代的精准营销
9.2、Logistic回归算法介绍
9.3、案例:信用卡消费信贷产品的精准营销
9.4、预测模型的应用与评估
9.5、本章小结
第10章:决策树类算法,反欺诈模型“专家”
10.1、决策树,重要的分类器
10.2、决策树的关键思想
10.3、案例:电商盗卡交易风险识别
10.4、随机森林
10.5、本章小结
第11章:数据可视化,是分析更是设计
11.1、数据演示之道
11.2、个性化地图
11.3、文本分析
11.4、本章小结
第三部分
应用篇
第12章:标签系统
12.1、认识标签系统
12.2、标签系统的设计
12.3、标签系统的实现
12.4、本章小结
第13章:数据自助营销平台
13.1、数据自助营销平台的价值所在
13.2、数据自助营销平台的实现原则
13.3、数据自助营销平台的场景实例
13.4、本章小结
第14章:基于Mahout的个性化推荐系统
14.1、Mahout的推荐引擎
14.2、规模与效率
14.3、实现一个推荐系统
14.4、本章小结
第15章:图计算与社会网络
15.1、社会网络和属性图
15.2、Spark
GraphX与Neo4j
15.3、使用Spark
GraphX和Neo4j处理社会网络
15.4、本章小结

相关推荐

微信二维码