从零开始学Python数据分析与挖掘

从零开始学Python数据分析与挖掘

作者:刘顺祥

出版社:清华大学

出版年:2018年10月

ISBN:9787302509875

所属分类:网络科技

书刊介绍

《从零开始学Python数据分析与挖掘》内容简介

本书以Python3版本作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。
本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。
刘顺祥,统计学硕士,“数据分析1480”微信公众号运营者。曾就职于大数据咨询公司,为联想、亨氏、美丽田园、网鱼网咖等企业项目提供服务;曾在唯品会大数据部担任数据分析师一职,负责电商支付环节的数据分析业务。

作品目录

作者简介
内容简介
前言
第1章:数据分析与挖掘概述
1.1、什么是数据分析和挖掘
1.2、数据分析与挖掘的应用领域
1.3、数据分析与挖掘的区别
1.4、数据挖掘的流程
1.5、常用的数据分析与挖掘工具
1.6、本章小结
第2章:从收入的预测分析开始
2.1、下载与安装Anoconda
2.2、基于Python的案例实战
2.3、本章小结
第3章:Python快速入门
3.1、数据结构及方法
3.2、控制流
3.3、字符串处理方法
3.4、自定义函数
3.5、一个爬虫案例
3.6、本章小结
第4章:Python数值计算工具——Numpy
4.1、数组的创建与操作
4.2、数组的基本运算符
4.3、常用的数学和统计函数
4.4、线性代数的相关计算
4.5、伪随机数的生成
4.6、本章小结
第5章:Python数据处理工具——Pandas
5.1、序列与数据框的构造
5.2、外部数据的读取
5.3、数据类型转换及描述统计
5.4、字符与日期数据的处理
5.5、常用的数据清洗方法
5.6、数据子集的获取
5.7、透视表功能
5.8、表之间的合并与连接
5.9、分组聚合操作
5.10、本章小结
第6章:Python数据可视化
6.1、离散型变量的可视化
6.2、数值型变量的可视化
6.3、关系型数据的可视化
6.4、多个图形的合并
6.5、本章小结
第7章:线性回归预测模型
7.1、一元线性回归模型
7.2、多元线性回归模型
7.3、回归模型的假设检验
7.4、回归模型的诊断
7.5、本章小结
第8章:岭回归与LASSO回归模型
8.1、岭回归模型
8.2、岭回归模型的应用
8.3、LASSO回归模型
8.4、LASSO回归模型的应用
8.5、本章小结
第9章:Logistic回归分类模型
9.1、Logistic模型的构建
9.2、分类模型的评估方法
9.3、Logistic回归模型的应用
9.4、本章小结
第10章:决策树与随机森林
10.1、节点字段的选择
10.2、决策树的剪枝
10.3、随机森林
10.4、决策树与随机森林的应用
10.5、本章小结
第11章:KNN模型的应用
11.1、KNN算法的思想
11.2、最佳k值的选择
11.3、相似度的度量方法
11.4、近邻样本的搜寻方法
11.5、KNN模型的应用
11.6、本章小结
第12章:朴素贝叶斯模型
12.1、朴素贝叶斯理论基础
12.2、几种贝叶斯模型
12.3、本章小结
第13章:SVM模型的应用
13.1、SVM简介
13.2、几种常见的SVM模型
13.3、分类问题的解决
13.4、预测问题的解决
13.5、本章小结
第14章:GBDT模型的应用
14.1、提升树算法
14.2、梯度提升树算法
14.3、非平衡数据的处理
14.4、XGBoost算法
14.5、本章小结
第15章:Kmeans聚类分析
15.1、Kmeans聚类
15.2、最佳k值的确定
15.3、Kmeans聚类的应用
15.4、Kmeans聚类的注意事项
15.5、本章小结
第16章:DBSCAN与层次聚类分析
16.1、密度聚类简介
16.2、密度聚类与Kmeans的比较
16.3、层次聚类
16.4、密度聚类与层次聚类的应用
16.5、本章小结

相关推荐

微信二维码