数据挖掘教程

数据挖掘教程

作者:李保坤.张丽娟编著

出版社:西南财经大学出版社

出版年:2009-07-01

评分:5分

ISBN:9787811384406

所属分类:网络科技

书刊介绍

数据挖掘教程 目录

**章介绍
1.1这本书的读者对象
1.2什么是数据挖掘
1.3数据挖掘的用途
1.4数据挖掘的起源
1.5术语和注释
1.6数据集合的组织
1.7数据挖掘迅速发展的因素
第二章数据挖掘过程概览
2.1数据挖掘的核心思想
2.2有约束学习和无约束学习
2.3数据挖掘的步骤
2.4semma
2.5预备阶段
附录:数据分块方法
2.6建立模型——线性回归的一个例子
第三章有约束学习——分类和预测
3.1一个分两类的分类法
3.2贝叶斯*小误差法则
3.3采用分类误差作为标准的分类方法评价
3.4不对称错误分类代价和贝叶斯风险
3.5分层采样和不对称代价
3.6推广到多于两类的情况
3.7提升图
3.8波士顿住房(两类)
3.9采用三分(triage)策略的分类
第四章多元线性回归
4.1多元线性回归复习
4.2回归过程举例
4.3线性回归的自变量选择
4.4线性回归分析的一般步骤
第五章logistic回归
5.1一个简单例子
5.2logistic回归模型
5.3机会比(odds ratio)
5.4概率
5.5模型拟合的又一个例子
附录a:回归系数的极大似然估计和置信区间计算
附录b:使用西南财大数据挖掘系统对波士顿住宅区的数据处理
第六章神经网络
6.1神经元(一个数学模型)
6.2神经网络
6.3费歇尔(fisher)的鸢尾花数据
6.4后向传播算法——分类
6.5调整网络用于预测
6.6多个区域*优和遍数
6.7过分拟合和训练遍数的选择
6.8结构的适应性选择
6.9成功应用的例子
附录:使用西南财大数据挖掘系统的神经网络分类演示
第七章分类与回归树
7.1分类树
7.2递归分区
7.3骑乘式割草机
7.4剪枝
7.5*小误差树
7.6*佳剪枝树
7.7树的分类规则
7.8回归树
附录:西南财大数据挖掘系统分类树介绍
第八章判别分析
8.1骑乘式割草机
8.2fisher的线性判别函数
8.3贝叶斯线性分类函数
8.4距离度量
8.5分类误差
8.6鸢尾花的分类
附录a:马氏距离
附录b:西南财大数据挖掘系统的判别分析
第九章其他有约束学习方法
9.1k-*近邻点
9.2简单贝叶斯
9.3简单贝叶斯分类实例
第十章关联分析——关联法则
10.1发现交易数据库里的关联法则
10.2支持度和置信度
10.3增益和重要性
10.4相关系数和负关联法则
10.5先验算法
10.6缺点
第十一章数据精简和探索
11.1降维——主成分分析
11.2成年长子的头部测量数值
11.3主成分
11.4葡萄酒的特征
11.5数据标准化
11.6主成分和正交*小二乘
第十二章聚类分析
12.1什么是聚类分析?
12.2电力公司数据
12.3层次聚类法
12.4k-均值算法
12.5相似测度
12.6其他的距离测度
附录:西南财大数据挖掘系统的聚类分析

数据挖掘教程 内容简介

这本书的文字内容主要参考了美国麻省理工学院的数据挖掘开放讲义、国外许多大学老师关于数据挖掘课程的教学资料以及网络上对有关算法的介绍材料。书中使用的数据均来自统计学教材或数据挖掘教材中使用的标准数据,数据分析结果和图形展示由作者自己制作的西南财经大学数据挖掘系统软件生成。

数据挖掘教程 作者简介

李保坤,美国新墨新墨西哥州立大学博士,西南财经大学统计学院副教授,应用统计研究所副所长。

相关推荐

微信二维码