Python爬虫、数据分析与可视化

Python爬虫、数据分析与可视化

作者:成立明胡书敏黄勇

出版社:机械工业

出版年:2020年11月

ISBN:9787111667759

所属分类:网络科技

书刊介绍

《Python爬虫、数据分析与可视化》内容简介

本书根据大多数软件公司对Python数据分析和可视化的需求,面向Python初学者讲述爬虫、数据分析、数据可视化和机器学习等方面的技术和实践案例。全书共13章:第1~4章为基础篇,主要讲述Python基础知识、Python数据结构、面向对象编程思想、Python异常处理和读写文件的技巧;第5~7章为数据分析的工具篇,主要讲述NumPy库、Pandas库和Matplotlib库的基本功能和应用;第8、9章为数据分析高级技能篇,主要通过爬取技术博客案例讲述基于Scrapy爬虫框架的实用技巧,以及数据分析的常用方法;第10~13章为综合案例篇,主要讲述图书分析案例、二手房数据分析案例、股票数据分析案例和基于sklearn库的机器学习相关实践,涉及线性回归分析、岭回归分析、SVM分类、KNN分类和逻辑回归等机器学习算法。本书语言通俗易懂,案例丰富,适合想要入职数据分析岗位的新手、大学生以及欲转行进入大数据分析领域的从业人员使用,也可以作为大专院校或培训机构的教学用书。
本书由成立明、胡书敏、黄勇编著。

作品目录

前言
本书内容
本书特点
本书源代码、教学视频、PPT课件
第1章:Python编程基础
1.1、搭建Python开发环境
1.2、实践Python基本语法
1.3、定义和调用函数
1.4、return的重要性——函数的递归调用
1.5、熟悉函数的特殊写法
1.6、本章小结
第2章:Python的数据结构
2.1、列表
2.2、元组
2.3、集合
2.4、字典
2.5、针对数据结构的通用性操作
2.6、本章小结
第3章:Python面向对象编程
3.1、什么是面向对象思想
3.2、封装特性
3.3、继承特性
3.4、多态特性
3.5、模块、包以及第三方库
3.6、本章小结
第4章:异常处理机制与文件读写
4.1、通过try…except…finally处理异常
4.2、raise与except的整合使用
4.3、异常处理的实践经验
4.4、在读写文件案例中使用异常机制
4.5、本章小结
第5章:NumPy数组处理
5.1、NumPy库的基础数据结构:ndarray对象
5.2、NumPy库的常用操作
5.3、针对ndarray的索引和切片操作
5.4、本章小结
第6章:Pandas数据清洗
6.1、以一维方式存储数据的Series对象
6.2、以表格格式存储数据的DataFrame对象
6.3、面向DataFrame的常用数据分析方法
6.4、Pandas与各类文件的交互
6.5、本章小结
第7章:Matplotlib数据可视化
7.1、通过Matplotlib绘制各类图形
7.2、设置坐标的技巧
7.3、增加可视化美观效果
7.4、设置多图和子图效果
7.5、绘制高级图表
7.6、通过mplot3d绘制三维图形
7.7、本章小结
第8章:通过网络爬虫获取数据
8.1、和爬虫有关的HTTP
8.2、通过Urllib库获取网页信息
8.3、通过BeautifulSoup提取页面信息
8.4、通过正则表达式截取信息
8.5、用Scrapy爬取博客园文章信息
8.6、本章小结
第9章:数据分析的常用方法
9.1、准备并存储数据
9.2、描述性统计
9.3、基于时间序列的统计方法
9.4、概率分析方法与推断统计
9.5、回归分析方法
9.6、本章小结
第10章:案例:图书信息的爬取、数据清洗与分词处理
10.1、用Scrapy框架爬取豆瓣网编程图书
10.2、分析图书数据,绘制可视化图表
10.3、本章小结
第11章:案例:二手房数据的爬取、清洗与可视化
11.1、用Scrapy框架爬取二手房数据
11.2、分析二手房数据
11.3、本章小结
第12章:案例:股票数据分析与可视化
12.1、股市指标的分析与可视化
12.2、验证常见的股市交易策略
12.3、绘制价格通道
12.4、用机器学习方法预测股票
12.5、本章小结
第13章:基于机器学习算法的数据分析
13.1、数据集与机器学习的基础知识
13.2、一元和多元线性回归案例
13.3、岭回归、Lasso回归及案例
13.4、分类算法案例
13.5、基于手写体数字识别的分类案例
13.6、本章小结

相关推荐

微信二维码