从零开始学Python数据分析

从零开始学Python数据分析

作者:罗攀

出版社:机械工业出版社

出版年:2018-8

评分:7.6

ISBN:9787111606468

所属分类:行业好书

书刊介绍

内容简介

网络中的信息是很庞大的。如何提取这些信息?如何分析这些信息?这都需要用到数据分析技术。而数据分析技术的*语言是Python,而本书便是一本适合“小白”学习Python数据分析的入门图书,书中不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过讲解多个案例,让读者体验数据背后的乐趣。

本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、外部数据读取与存储、数据清洗与整理、数据分组与聚合、matplotlib可视化、seaborn可视化、pyecharts可视化、时间序列、网站日志分析综合案例等。

本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析的培训教材或者参考书。

本书特色:

手把手带领“小白”轻松入门Python数据分析

全面涵盖数据分析的流程、工具、框架和方法,内容新,实战案例多

详细介绍从数据读取到数据清洗,以及从数据处理到数据可视化等实用技术

作品目录

第1章 Python环境搭建与使用 1
1.1 Anaconda的安装和使用 1
1.1.1 Anaconda的安装 1
1.1.2 Anaconda的使用 3
1.2 Jupyter Notebook的使用 5
1.2.1 更改工作空间 5
1.2.2 界面介绍与使用 7
第2章 NumPy入门和实战 9
2.1 ndarray多维数组 9
2.1.1 创建ndarray数组 9
2.1.2 ndarray对象属性 12
2.1.3 ndarray数据类型 13
2.1.4 数组变换 15
2.1.5 NumPy的随机数函数 18
2.2 数组的索引和切片 20
2.2.1 数组的索引 21
2.2.2 数组的切片 23
2.2.3 布尔型索引 24
2.2.4 花式索引 26
2.3 数组的运算 26
2.3.1 数组和标量间的运算 26
2.3.2 通用函数 27
2.3.3 条件逻辑运算 28
2.3.4 统计运算 30
2.3.5 布尔型数组运算 31
2.3.6 排序 32
2.3.7 集合运算 33
2.3.8 线性代数 34
2.4 数组的存取 34
2.4.1 数组的存储 35
2.4.2 数组的读取 35
2.5 综合示例——图像变换 35
第3章 pandas入门和实战 38
3.1 pandas数据结构 38
3.1.1 创建Series数据 38
3.1.2 创建DataFrame数据 40
3.1.3 索引对象 43
3.2 pandas索引操作 44
3.2.1 重新索引 45
3.2.2 更换索引 46
3.2.3 索引和选取 48
3.2.4 操作行和列 52
3.3 pandas数据运算 53
3.3.1 算术运算 54
3.3.2 函数应用和映射 55
3.3.3 排序 56
3.3.4 汇总与统计 57
3.3.5 值和值计数 58
3.4 层次化索引 59
3.4.1 层次化索引简介 59
3.4.2 重排分级顺序 60
3.4.3 汇总统计 61
3.5 pandas可视化 61
3.5.1 线形图 61
3.5.2 柱状图 63
3.5.3 直方图和密度图 66
3.5.4 散点图 67
3.6 综合示例——小费数据集 68
第4章 外部数据的读取与存储 73
4.1 文本数据的读取与存储 73
4.2 JSON和Excel数据的读取与存储 82
4.3 数据库的读取与存储 87
4.4 Web数据的读取 90
第5章 数据清洗与整理 95
5.1 数据清洗 95
5.2 数据合并和重塑 104
5.3 字符串处理 116
5.4 综合示例——Iris数据集 118
第6章 数据分组与聚合 125
6.1 数据分组 125
6.2 聚合运算 132
6.3 分组运算 136
6.4 数据透视表 139
6.5 综合实例——巴尔的摩公务员工资数据集 142
第7章 matplotlib可视化 148
7.1 线形图 148
7.2 柱状图 152
7.3 其他基本图表 158
7.4 自定义设置 159
7.5 综合示例——星巴克店铺数据集 164
第8章 seaborn可视化 172
8.1 样式与分布图 172
8.2 分类图 181
8.3 回归图与网格 187
8.4 综合示例——泰坦尼克号生还者数据 191
第9章 pyecharts可视化 202
9.1 基础图表 202
9.2 其他图表 209
9.3 综合示例——糗事百科用户数据 213
第10章 时间序列 224
10.1 datetime模块 224
10.2 时间序列基础 228
10.3 日期 231
10.4 时期 235
10.5 频率转换与重采样 238
10.6 综合示例——自行车租赁数据 241
第11章 综合案例——网站日志分析 248
11.1 数据来源 248
11.2 日志数据分析 252
11.2.3 IP地址分析 258
· · · · · ·

作者简介

罗攀 知名论坛Python爬虫专题管理员。擅长Python爬虫、Python数据分析与挖掘等技术。曾经在CSDN等多个知名博客网站上发表了多篇技术文章,深受读者的喜爱。参与编写并出版了《从零开始学Python网络爬虫》一书。目前从事线上Python网络爬虫的培训工作。

精彩摘录

在许多行业中,时间序列数据是一种重要的结构化数据类型。本章主要讲解datetime的数据类型及与字符串的相互转换方法:时间序列的构造和使用方法;日期和时期数据的使用方法:时间序列的频率转换与重采样;最后通过一个综合示例,讲解时间序列数据的处理与分析方法。下面给出本章涉及的知识点与学习目标。。datetime库:学会构造时间数据及其与字符串的相互转换。。时间序列:学会构造时间序列和使用方法。。日期与时期:学会日期与时期的使用方法。。频率转换与重采样:学会resample函数的使用方法。

——引自第224页

相关推荐

微信二维码