SPSS Modeler+Weka数据挖掘从入门到实战

SPSS Modeler+Weka数据挖掘从入门到实战

作者:经管之家 主编李御玺唐绍祖马伯曾珂 编著

出版社:电子工业

出版年:2019年5月

ISBN:9787121319112

所属分类:心理健康

书刊介绍

《SPSS Modeler+Weka数据挖掘从入门到实战》内容简介

《SPSS Modeler+Weka数据挖掘从入门到实战》是一本面向商业数据挖掘建模分析人员的教材,从具体的商业数据分析案例入手,帮助读者掌握数据挖掘的目的、方法、工具与分析步骤。本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但不具有前沿技术的分析模块,以及很难与现有的信息系统结合,而Weka恰能弥补其不足。同时,这两个软件都不需要编程,适合初学者。本书具体内容由四位活跃在数据挖掘教学和项目开发领域的人员完成,内容侧重软件的实际操作。本书力图以浅显的方式解释复杂的技术原理,尽量避免涉及过多的数学内容。
李御玺,台湾大学资讯工程博士,其研究领域专注于数据仓库、数据挖掘与文本挖掘。
唐绍祖,CDA数据分析师教研团队成员,CDA深圳地区教研负责人。
马伯,哈尔滨工业大学数字影视媒体技术学士。
曾珂,华中师范大学管理科学工程硕士,现为某互联网金融公司数据产品经理。

作品目录

作者简介
前言
第1篇
理论篇
第1章:数据挖掘简介
1.1、数据挖掘的起源、定义及目标
1.2、数据挖掘的发展历程
1.3、SPSS
Modeler和Weka基础操作
第2章:数据挖掘方法论
2.1、数据挖掘方法论
2.2、数据库中的知识挖掘步骤
2.3、案例:运用SPSS
Modeler和Weka做客户的信用风险评分模型
第3章:基本的数据挖掘技术
3.1、描述性统计
3.2、可视化技术
3.3、KNN原理及实例
3.4、案例:运用Weka的KNN算法对诊断结果进行预测
3.5、案例:运用SPSS
Modeler的KNN算法预测客户是否接受人寿保险推销
第4章:数据挖掘进阶技术
4.1、数据挖掘的功能分类
4.2、数据挖掘的绩效增益
4.3、数据挖掘网站
4.4、案例:评估新产品的促销活动效果
第2篇
准备篇
第5章:数据预处理
5.1、字段选择
5.2、数据清洗
5.3、字段扩充
5.4、数据编码
第6章:关键变量挖掘技术
6.1、无效变量
6.2、统计方式的变量选择
6.3、模型方式的变量选择
第7章:贝叶斯网络
7.1、朴素贝叶斯
7.2、什么是贝叶斯网络
第8章:线性回归
8.1、简单线性回归
8.2、多元回归
8.3、相关系数
8.4、回归分析案例
8.5、线性回归模型评估
8.6、案例:运用SPSS
Modeler建立线性回归模型
第9章:决策树
9.1、ID3决策树模型
9.2、ID3算法
9.3、C5.0算法
9.4、CART算法
9.5、CHAID算法
9.6、案例:运用SPSS
Modeler和Weka建立决策树模型
9.7、CART回归树算法
9.8、案例:运用SPSS
Modeler和Weka建立回归树模型
第10章:神经网络
10.1、BP神经网络模型
10.2、神经元的组成
10.3、神经网络模型如何传递信息
10.4、修正神经网络模型的权重值及常数项
10.5、BP神经网络模型与Logistic回归、线性回归及非线性回归之间的关系
10.6、案例:运用SPSS
Modeler建立类神经网络模型
第11章:Logistic回归
11.1、Logistic回归与BP神经网络的关系
11.2、Logistic回归的字段选择方式
11.3、案例:运用SPSS
Modeler建立Logistic回归模型
第12章:支持向量机
12.1、数据是线性可分的支持向量机
12.2、数据是线性不可分的支持向量机
12.3、案例:运用SPSS
Modeler建立SVM模型
第3篇
关系篇
第13章:聚类分析
13.1、相似性度量
13.2、聚类算法
13.3、分层聚类算法
13.4、分割式聚类算法
13.5、集群判断
13.6、案例:运用SPSS
Modeler建立聚类模型
第14章:关联规则
14.1、关联规则的概念
14.2、关联规则的评估指标
14.3、Apriori算法
14.4、Apriori算法实例说明
14.5、再谈评估指标
14.6、关联规则的延伸
14.7、案例:运用SPSS
Modeler建立关联规则模型
第15章:序列模型
15.1、序列模型的概念
15.2、案例:运用SPSS
Modeler建立序列模型

相关推荐

微信二维码