书刊介绍
《数据挖掘:实用案例分析》内容简介
《数据挖掘:实用案例分析》是数据挖掘实战领域颇具特色的一部作品,作者曾为10余个行业上百家大型企业提供数据挖掘服务,本书是其在数据挖掘领域探索近10年的经验总结之作。全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举。
《数据挖掘:实用案例分析》共12章,分三个部分。第一部分是基础篇(第1~4章),主要对数据挖掘的基本概念、应用分类、建模方法及常用的建模工具进行了介绍,并对本书所用到的数据挖掘建模平台TipDM进行了说明。第二部分是实战篇(第5~10章),以案例的形式对数据挖掘技术在金融、电信、电力、互联网、生产制造以及公共服务等行业的应用场景进行了讨论;首先介绍案例背景,然后阐述分析方法与过程,最后完成模型构建;在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中;此外,第10章精心设计了6个实验项目,读者可以通过本章介绍的方法动手实践,以巩固数据挖掘知识,在分析建模过程的同时,进一步增强动手能力。第三部分是高级篇(第11~12章),主要介绍基于第三方接口的数据挖掘二次开发技术,重点对常用的WEKA和MATLAB数据挖掘算法接口进行了探讨;最后对基于Hadoop框架的海量数据挖掘进行了说明,以满足读者更高层次的需求。
随书光盘中提供了本书的相关资料和案例资源,以及6个动手实验所使用的完整数据,方便读者动手实践书中所讲解的案例。
张良均,资深数据挖掘专家和模式识别专家,有近10年的数据挖掘应用与咨询经验,8年多的数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。为电信、电力、零售、农业、银行、电力、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学客座教授,著有《神经网络实用教程》一书。作品目录
数据挖掘:实用案例分析
前言
为什么要写这本书
读者对象
如何阅读本书
勘误和支持
致谢
第一部分
基础篇
第1章:初识数据挖掘
1.1、什么是数据挖掘
1.2、数据挖掘在企业商务智能应用中的定位
1.2.1、数据挖掘给企业带来最大的投资收益
1.2.2、数据挖掘从本质上提升商务智能平台的价值
1.2.3、数据挖掘让商务智能流程真正形成闭环
1.3、信息类BI应用与知识类BI应用
1.4、数据挖掘现状及应用前景
1.5、本章小结
第2章:数据挖掘的应用分类
2.1、分类与回归
2.1.1、分类与回归建模原理
2.1.2、分类与回归算法
2.2、聚类
2.2.1、聚类分析建模原理
2.2.2、聚类算法
2.3、关联规则
2.3.1、什么是关联规则
2.3.2、关联规则算法
2.4、时序模式
2.4.1、什么是时序模式
2.4.2、时间序列的组合成分
2.4.3、时间序列的组合模型
2.4.4、时序算法
2.5、偏差检测
2.6、本章小结
第3章:数据挖掘建模
3.1、数据挖掘的过程
3.2、数据挖掘建模过程
3.2.1、定义挖掘目标
3.2.2、数据取样
3.2.3、数据探索
3.2.4、预处理
3.2.5、模式发现
3.2.6、模型构建
3.2.7、模型评价
3.3、常用的建模工具
3.4、本章小结
第4章:顶尖数据挖掘平台TipDM
4.1、TipDM产品功能
4.1.1、TipDM平台提供的数据探索及预处理算法
4.1.2、TipDM平台提供的分类与回归算法
4.1.3、TipDM平台提供的时序模式算法
4.1.4、TipDM平台提供的聚类分析算法
4.1.5、TipDM平台提供的关联规则算法
4.2、TipDM使用说明
4.3、TipDM产品特点
4.3.1、支持CRISP-DM数据挖掘标准流程
4.3.2、提供丰富的数据挖掘模型和灵活算法
4.3.3、具有多模型的整合能力
4.3.4、提供灵活多样的应用开发接口
4.3.5、海量数据的处理能力
4.3.6、适应不同类型层次人员需求
4.4、本章小结
第二部分
实战篇
第5章:数据挖掘在金融电信行业的应用
5.1、案例一:基于公司价值评价的证券策略投资
5.1.1、挖掘目标的提出
5.1.2、分析方法与过程
5.1.3、建模仿真
5.1.4、核心知识点
5.1.5、拓展思考
5.2、案例二:电信3G客户识别系统
5.2.1、挖掘目标的提出
5.2.2、分析方法与过程
5.2.3、建模仿真
5.2.4、核心知识点
5.2.5、拓展思考
5.3、案例三:基于客户分群的精准智能营销
5.3.1、挖掘目标的提出
5.3.2、分析方法与过程
5.3.3、建模仿真
5.3.4、核心知识点
5.3.5、拓展思考
5.4、本章小结
第6章:数据挖掘在电力行业的应用
6.1、案例一:电力负荷预测
6.1.1、挖掘目标的提出
6.1.2、分析方法与过程
6.1.3、建模仿真
6.1.4、核心知识点
6.1.5、拓展思考
6.2、案例二:自适应防窃漏电实时诊断
6.2.1、挖掘目标的提出
6.2.2、分析方法与过程
6.2.3、建模仿真
6.2.4、核心知识点
6.2.5、扩展思考
6.3、本章小结
第7章:数据挖掘在互联网行业的应用
7.1、案例一:商业零售行业中的购物篮分析
7.1.1、挖掘目标的提出
7.1.2、分析方法与过程
7.1.3、建模仿真
7.1.4、核心知识点
7.1.5、拓展思考
7.2、案例二:电子商务网站用户行为分析
7.2.1、挖掘目标的提出
7.2.2、分析方法与过程
7.2.3、建模仿真
7.2.4、核心知识点
7.2.5、拓展思考
7.3、案例三:网络入侵智能检测
7.3.1、挖掘目标的提出
7.3.2、分析方法与过程
7.3.3、建模仿真
7.3.4、核心知识点
7.3.5、拓展思考
7.4、案例四:基于用户行为分析的定向网络广告投放
7.4.1、挖掘目标的提出
7.4.2、分析方法与过程
7.4.3、建模仿真
7.4.4、结果及分析
7.4.5、核心知识点
7.4.6、拓展思考
7.5、案例五:企业信息系统用户服务感知评价
7.5.1、挖掘目标的提出
7.5.2、分析方法与过程
7.5.3、建模仿真
7.5.4、核心知识点
7.5.5、拓展思考
7.6、本章小结
第8章:数据挖掘在生产制造行业中的应用
8.1、案例一:基于小波变换的桩基完整性检测
8.1.1、挖掘目标的提出
8.1.2、分析方法与过程
8.1.3、仿真过程
8.1.4、核心知识点
8.1.5、拓展思考
8.2、案例二:基于水色图像的水质评价
8.2.1、挖掘目标的提出
8.2.2、分析方法与过程
8.2.3、建模仿真
8.2.4、核心知识点
8.2.5、拓展思考
8.3、案例三:生物质废物混合厌氧消化优势组分互补机制
8.3.1、挖掘目标的提出
8.3.2、分析方法与过程
8.3.3、建模仿真
8.3.4、核心知识点
8.3.5、拓展思考
8.4、案例四:基于RFM的企业客户关系分析
8.4.1、挖掘目标的提出
8.4.2、分析过程与方法
8.4.3、建模仿真
8.4.4、核心知识点
8.4.5、拓展思考
8.5、案例五:水产养殖投入产出多目标优化仿真
8.5.1、挖掘目标的提出
8.5.2、分析方法与过程
8.5.3、建模仿真
8.5.4、核心知识点
8.5.5、拓展思考
8.6、本章小结
第9章:数据挖掘在公共服务行业的应用
9.1、案例一:乳腺癌证素变化规律及截断疗法
9.1.1、挖掘目标的提出
9.1.2、分析方法与过程
9.1.3、建模仿真
9.1.4、核心知识点
9.1.5、拓展思考
9.2、案例二:卷烟消费者购买行为分析
9.2.1、挖掘目标的提出
9.2.2、分析过程与方法
9.2.3、挖掘建模
9.2.4、核心知识点
9.2.5、拓展思考
9.3、案例三:纳税人偷漏税评估
9.3.1、挖掘目标的提出
9.3.2、分析方法与过程
9.3.3、建模仿真
9.3.4、核心知识点
9.3.5、拓展思考
9.4、案例四:道路缺陷自动识别
9.4.1、挖掘目标的提出
9.4.2、分析方法与过程
9.4.3、建模仿真
9.4.4、核心知识点
9.4.5、拓展思考
9.5、案例五:航空公司客运信息挖掘
9.5.1、挖掘目标的提出
9.5.2、分析方法与过程
9.5.3、建模仿真
9.5.4、核心知识点
9.5.5、拓展思考
9.6、本章小结
第10章:动手实践
10.1、实验一:数据探索及数据预处理
10.2、实验二:神经网络模型的构建与使用
10.3、实验三:决策树模型的构建与使用
10.4、实验四:聚类算法的构建与使用
10.5、实验五:关联规则模型的构建与使用
10.6、实验六:时间序列模型的构建与使用
10.7、本章小结
第三部分
高级篇
第11章:基于第三方接口的数据挖掘二次开发
11.1、WEKA数据挖掘接口
11.1.1、WEKA功能及其算法
11.1.2、WEKA包结构
11.1.3、WEKA算法入口
11.1.4、二次开发相关输出
11.2、MATLAB数据挖掘接口
11.3、案例:基于MATLAB接口的数据挖掘二次开发
11.3.1、接口算法编程
11.3.2、用Java
Builder创建Java组件
11.3.3、安装MATLAB运行时环境
11.3.4、JDK环境及设置
11.3.5、接口算法调用
11.4、本章小结
第12章:基于Hadoop框架的海量数据挖掘开发
12.1、基于云计算的海量数据挖掘技术特点
12.2、基于Hadoop的并行数据挖掘算法工具箱TipCDM
12.3、案例:基于海量计量数据的电力客户在线分群方法
12.3.1、挖掘目标的提出
12.3.2、分析方法与过程
12.3.3、建模仿真
12.3.4、核心知识点
12.4、本章小结
参考文献