利用Python进行数据分析(原书第2版)

利用Python进行数据分析(原书第2版)

作者:[美] 韦斯·麦金尼(Wes McKinney)

出版社:机械工业

出版年:2018年6月

ISBN:9787111603702

所属分类:行业好书

书刊介绍

《利用Python进行数据分析(原书第2版)》内容简介

阅读本书可以获得关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第2版针对Python3.6进行了更新,并增加了实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到最新版本的pandas、NumPy、IPython和Jupyter。
韦斯·麦金尼(WesMcKinney),是流行的Python开源数据分析库pandas的创始人。他是一名活跃的演讲者,也是Python数据社区和Apache软件基金会的Python/C开源开发者。目前他在纽约从事软件架构师工作。

作品目录

译者序
前言
第1章:准备工作
1.1、本书内容
1.2、为何利用Python进行数据分析
1.3、重要的Python库
1.4、安装与设置
1.5、社区和会议
1.6、快速浏览本书
第2章:Python语言基础、IPython及Jupyter
notebook
2.1、Python解释器
2.2、IPython基础
2.3、Python语言基础
第3章:内建数据结构、函数及文件
3.1、数据结构和序列
3.2、函数
3.3、文件与操作系统
3.4、本章小结
第4章:NumPy基础:数组与向量化计算
4.1、NumPy
ndarray:多维数组对象
4.2、通用函数:快速的逐元素数组函数
4.3、使用数组进行面向数组编程
4.4、使用数组进行文件输入和输出
4.5、线性代数
4.6、伪随机数生成
4.7、示例:随机漫步
4.8、本章小结
第5章:pandas入门
5.1、pandas数据结构介绍
5.2、基本功能
5.3、描述性统计的概述与计算
5.4、本章小结
第6章:数据载入、存储及文件格式
6.1、文本格式数据的读写
6.2、二进制格式
6.3、与Web
API交互
6.4、与数据库交互
6.5、本章小结
第7章:数据清洗与准备
7.1、处理缺失值
7.2、数据转换
7.3、字符串操作
7.4、本章小结
第8章:数据规整:连接、联合与重塑
8.1、分层索引
8.2、联合与合并数据集
8.3、重塑和透视
8.4、本章小结
第9章:绘图与可视化
9.1、简明matplotlib
API入门
9.2、使用pandas和seaborn绘图
9.3、其他Python可视化工具
9.4、本章小结
第10章:数据聚合与分组操作
10.1、GroupBy机制
10.2、数据聚合
10.3、应用:通用拆分-应用-联合
10.4、数据透视表与交叉表
10.5、本章小结
第11章:时间序列
11.1、日期和时间数据的类型及工具
11.2、时间序列基础
11.3、日期范围、频率和移位
11.4、时区处理
11.5、时间区间和区间算术
11.6、重新采样与频率转换
11.7、移动窗口函数
11.8、本章小结
第12章:高阶pandas
12.1、分类数据
12.2、高阶GroupBy应用
12.3、方法链技术
12.4、本章小结
第13章:Python建模库介绍
13.1、pandas与建模代码的结合
13.2、使用Patsy创建模型描述
13.3、statsmodels介绍
13.4、scikit-learn介绍
13.5、继续你的教育
第14章:数据分析示例
14.1、从Bitly获取1.USA.gov数据
14.2、MovieLens
1M数据集
14.3、美国1880~2010年的婴儿名字
14.4、美国农业部食品数据库
14.5、2012年联邦选举委员会数据库
14.6、本章小结
附录A
高阶NumPy
A.1、ndarray对象内幕
A.2、高阶数组操作
A.3、广播
A.4、高阶ufunc用法
A.5、结构化和记录数组
A.6、更多关于排序的内容
A.7、使用Numba编写快速NumPy函数
A.8、高阶数组输入和输出
A.9、性能技巧
附录B
更多IPython系统相关内容
B.1、使用命令历史
B.2、与操作系统交互
B.3、软件开发工具
B.4、使用IPython进行高效代码开发的技巧
B.5、高阶IPython特性
B.6、附录小结

相关推荐

微信二维码