数据挖掘

数据挖掘

作者:王朝霞

出版社:电子工业

出版年:2018年3月

ISBN:9787121335310

所属分类:经济金融

书刊介绍

《数据挖掘》内容简介

2017年年初,在中国信息协会大数据分会副会长刘鹏教授的倡议和组织下,全国上百家高校从事一线教学科研任务的教师,开展了高级大数据人才培养丛书的编撰工作。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。
本书适合作为相关专业本科生和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
王朝霞,1995年在重庆大学获得学士学位,2003年在中国人民解放军后勤工程学院获得硕士学位,2012年在清华大学获得博士学位,现于中国人民解放军陆军勤务学院任教,副教授、硕导。计算机科学与技术学科、后勤信息化学科中青年骨干。
主(持)研科研项目35项,其中,主持科研项目1项、省部级6项。发表论文40余篇,SCI收录期刊论文2篇(1作)、EI收录论文10篇(1作6篇)。出版专著3本,获国家发明专利3项。获教育部科技进步一等奖1项,多次荣获学院优秀教员荣誉称号、学院教学研究成果奖和教学质量奖。

作品目录

内容简介







第1章:绪

1.1、数据挖掘概述
1.2、数据挖掘起源及发展历史
1.3、数据挖掘常用工具
1.4、数据挖掘应用场景
习题
参考文献
第2章:数据预处理与相似性
2.1、数据类型
2.2、数据预处理
2.3、数据的相似性
习题
参考文献
第3章:分

3.1、分类的基本概念、分类过程及分类器性能的评估
3.2、决策树
3.3、贝叶斯分类
3.4、支持向量机
3.5、实战:决策树算法在Weka中的实现
习题
参考文献
第4章:回

4.1、回归概述
4.2、一元回归分析
4.3、多元线性回归分析
4.4、逻辑回归分析
4.5、其他回归分析
4.6、实战:用回归分析方法给自己的房子定价
习题
参考文献
第5章:聚

5.1、聚类概述
5.2、划分方法
5.3、层次方法
5.4、基于密度的方法
5.5、实战:聚类分析
习题
参考文献
第6章:关联规则
6.1、概述
6.2、Apriori算法:通过限制候选项集产生发现频繁项集
6.3、FP-growth算法
6.4、其他关联规则算法
6.5、实战:个人信用关联规则挖掘
习题
参考文献
第7章:常用大数据挖掘算法优化改进
7.1、分类算法
7.2、聚类算法
7.3、关联规则
习题
参考文献
第8章:推荐系统
8.1、推荐系统概述
8.2、基于内容的推荐
8.3、协同过滤
8.4、其他推荐技术
8.5、实战:基于协同过滤算法推荐电影
习题
参考文献
第9章:互联网数据挖掘
9.1、链接分析与网页排序
9.2、互联网信息抽取
9.3、日志挖掘与查询分析
习题
参考文献
附录A
数据挖掘工具Weka
A.1、Weka简介
A.2、Explorer界面
A.3、Knowledge
Flow界面
A.4、Experimenter界面
习题
参考文献
附录B
Spark
机器学习库MLlib
B.1、Spark简介
B.2、Spark
RDD
B.3、Spark
MLlib简介
B.4、Spark
MLlib数据类型
B.5、Spark
MLlib算法库
习题
参考文献
附录C
大数据和人工智能实验环境

相关推荐

微信二维码