R语言

R语言

作者:程显毅 等

出版社:清华大学

出版年:2019年1月

ISBN:9787302494324

所属分类:散文随笔

书刊介绍

《R语言》内容简介

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。
全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则。其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和进阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。进阶篇解决如何用R处理大数据的一些关键技术。
本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。
程显毅,1956年12月生,哈尔滨人,教授,博士,现任中国人工智能学会知识工程专委会委员、江苏省微电脑学会人工智能专委会副主任委员、江苏省人工智能学会监事、江苏省大数据专家委员会委员、江苏省云计算论坛专家委员会委员。

作品目录

内容简介
总主编简介
本书主编简介




第1章:绪

1.1、为什么学习R语言
1.2、正确的数据思维观
习题
基础篇
第2章:R语言入门
2.1、新手上路
2.2、R语言开发环境部署
2.3、获取帮助
2.4、工作空间
2.5、脚本
2.6、R包
习题
第3章:数据类型
3.1、变量与常量
3.2、结构类型
3.3、字符串操作
3.4、用于数据处理和转换的常用函数
习题
第4章:数据准备
4.1、数据导入
4.2、数据导出
习题
第5章:数据可视化
5.1、低水平绘图命令
5.2、高水平绘图命令
5.3、交互式绘图命令
习题
第6章:数据探索
6.1、缺失值分析
6.2、异常值分析
6.3、不一致值分析
6.4、数据的统计特征分析
习题
第7章:数据变换
7.1、数据清洗
7.2、数据选择
7.3、数据集成
习题
第8章:高级编程
8.1、控制结构
8.2、用户自定义函数
习题
第9章:数据建模
9.1、Rattle包
9.2、聚类模型
9.3、关联分析模型
9.3.4、Apriori算法
9.4、传统决策树模型
9.5、随机森林决策树模型
9.6、自适应选择决策树模型
9.7、SVM
9.8、线性回归模型
9.9、神经网络模型
习题
第10章:模型评估
10.1、数据集
10.2、混淆矩阵
10.3、风险图
10.4、ROC曲线
习题
应用篇
第11章:影响大学平均录取分数线因素分析
11.1、背景与目标
11.2、数据说明
11.3、描述性分析
11.4、总结与建议
第12章:收视率分析
12.1、背景介绍
12.2、数据说明
12.3、描述性分析
12.4、总结与建议
进阶篇
第13章:RHadoop
13.1、认识RHadoop
13.2、RHadoop安装
13.3、综合练习
习题
第14章:SparkR
14.1、认识SparkR
14.2、SparkDataFrame
14.3、SparkR支持的机器学习算法
14.4、综合练习
习题
参考文献
附录
大数据和人工智能实验环境
附录CD

相关推荐

微信二维码