R语言预测实战

R语言预测实战

作者:游皓麟

出版社:电子工业出版社

出版年:2016-10-01

评分:5分

ISBN:9787121298547

所属分类:网络科技

书刊介绍

R语言预测实战 本书特色

R语言具有上手快、效率高的特点,它横跨金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。预测是数据挖掘的主要作用之一,也是大数据时代的核心价值所在。基于R语言来做预测,兼具效率和价值的双重属性,这是本书的一大亮点。本书共分为三部分。**部分讲预测基础,主要涵盖预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握进行预测的基本步骤和方法思路;第二部分讲预测算法,该部分包含了多元回归分析、复杂回归分析、时间序列及进阶算法,内容比较有难度,需要细心体会;第三部分讲预测案例,包括短期日负荷曲线预测和股票价格预测两个实例,读者可以了解到实施预测时需要关注的技术细节。希望读者在看完本书后,能够将本书的精要融会贯通,进一步在工作和学习实践中提炼价值。

R语言预测实战 内容简介

本书注重算法理论与实际案例相结合,将枯燥无味的预测算法原理用R语言重现,并通过案例让读者掌握预测模型的应用。

R语言预测实战 目录

**部分预测入门篇
第1章预测入门2
1.1什么是预测3
1.1.1预测的定义3
1.1.2预测的特点4
1.1.3预测的分类4
1.1.4预测的基本原则5
1.2大数据与预测7
1.2.1什么是大数据7
1.2.2大数据预测的优势9
1.2.3大数据预测的特征9
1.2.4大数据预测案例12
1.3预测利器之R语言22
1.3.1R语言简介22**部分预测入门篇
第1章预测入门2
1.1什么是预测3
1.1.1预测的定义3
1.1.2预测的特点4
1.1.3预测的分类4
1.1.4预测的基本原则5
1.2大数据与预测7
1.2.1什么是大数据7
1.2.2大数据预测的优势9
1.2.3大数据预测的特征9
1.2.4大数据预测案例12
1.3预测利器之R语言22
1.3.1R语言简介22
1.3.2R语言预测初步33
1.3.3R语言预测常用包42
第2章预测方法论44
2.1预测流程45
2.1.1确定主题45
2.1.2收集数据47
2.1.3选择方法49
2.1.4分析规律53
2.1.5建立模型57
2.1.6评估效果60
2.1.7发布模型60
2.2指导原则61
2.2.1界定问题61
2.2.2判断预测法63
2.2.3外推预测法64
2.2.4因果预测法66
2.3团队构成66
2.3.1成员分类67
2.3.2数据氛围68
2.3.3团队合作70
第3章分析方法72
3.1相关分析73
3.1.1自相关分析73
3.1.2偏相关分析74
3.1.3简单相关分析75
3.1.4互相关分析83
3.1.5典型相关分析84
3.2对应分析88
3.3频谱分析92
3.4趋势分析94
3.5聚类分析96
3.5.1K-Means算法96
3.5.2系统聚类算法99
3.6关联分析105
3.6.1关联规则挖掘:Apriori与Eclat算法105
3.6.2序列模式挖掘:SPADE算法119
第4章特征构建技术132
4.1特征变换133
4.1.1概念分层134
4.1.2标准化136
4.1.3离散化139
4.1.4函数变换142
4.1.5深入表达143
4.2特征组合143
4.2.1基于特定的领域知识143
4.2.2二元组合144
4.2.3高阶多项式148
4.3自动生成:基于遗传编程的方法152
4.3.1基本思路153
4.3.2特征表达式154
4.3.3产生初始种群162
4.3.4计算适应度163
4.3.5选择、交叉和变异165
4.3.6实例分析171
第5章特征选择方法176
5.1直接法177
5.2单元法177
5.2.1Pearson相关系数177
5.2.2距离相关系数179
5.2.3单因素方差分析181
5.2.4信息增益184
5.2.5卡方检验191
5.2.6Gini系数194
5.3多元法198
5.3.1逐步回归198
5.3.2随机森林203
5.3.3遗传算法210
第6章模型参数优化213
6.1交叉验证214
6.2网格搜索215
6.3遗传算法217
6.3.1基本概念217
6.3.2遗传算法算例218
6.3.3遗传算法实现步骤223
6.3.4遗传算法R语言实现223
6.3.5R语言mcga和genalg包的应用228
6.4粒子群优化233
6.4.1基本概念及原理233
6.4.2粒子群算法R语言实现235
6.4.3粒子群算法实现步骤238
6.4.4R语言pso包的应用239
6.5模拟退火241
6.5.1基本概念及原理241
6.5.2模拟退火算法R语言实现242
6.5.3模拟退火算法实现步骤244
6.5.4R语言GenSA和stats包的应用245
第7章预测效果评估250
7.1概率预测评估方法251
7.1.1混淆矩阵251
7.1.2ROC曲线255
7.1.3KS曲线261
7.1.4累计收益图263
7.1.5累计提升图264
7.1.6累计响应图266
7.2数值预测评估方法267
7.2.1常见评估指标267
7.2.2ASD累计收益图270
第二部分预测算法篇
第8章线性回归及其优化274
8.1多元线性回归275
8.1.1回归模型和基本假定275
8.1.2*小二乘估计276
8.1.3回归方程和回归系数的显著性检验276
8.1.4多重共线性277
8.2 Ridge回归280
8.2.1基本概念281
8.2.2岭迹曲线281
8.2.3基于GCV准则确定岭参数283
8.2.4Ridge回归的R语言实现284
8.3 Lasso回归285
8.3.1基本概念285
8.3.2使用LAR求解Lasso286
8.3.3Lasso算法的R语言实现288
8.3.4R语言lars包的应用290
8.4分位数回归292
8.4.1基本概念292
8.4.2分位数回归的计算294
8.4.3用单纯形法求解分位数回归及R语言实现296
8.4.4R语言quantreg包的应用298
8.5稳健回归300
8.5.1基本概念301
8.5.2M-估计法及其R语言实现301
8.5.3应用R语言MASS包实现稳健回归304
第9章复杂回归分析307
9.1梯度提升回归树(GBRT)308
9.1.1Boosting方法简介308
9.1.2AdaBoost算法308
9.1.3提升回归树算法311
9.1.4梯度提升312
9.1.5GBRT的R语言实现314
9.1.6R语言gbm包的应用316
9.2神经网络320
9.2.1基本概念320
9.2.2单层感知器学习算法322
9.2.3SLP回归算法的R语言实现323
9.2.4BP神经网络学习算法325
9.2.5BP回归算法的R语言实现327
9.2.6RBF神经网络学习算法330
9.2.7RBF回归算法的R语言实现332
9.2.8Elman神经网络学习算法334
9.2.9Elman回归算法的R语言实现336
9.2.10使用R语言包构建神经网络338
9.3支持向量机回归343
9.3.1基本问题344
9.3.2LS-SVMR算法347
9.3.3LS-SVMR算法的R语言实现348
9.4高斯过程回归349
9.4.1GPR算法350
9.4.2GPR算法的R语言实现352
9.4.3R语言kernlab包的应用355
第10章时间序列分析358
10.1 Box-Jenkins方法359
10.1.1p阶自回归模型359
10.1.2q阶移动平均模型361
10.1.3自回归移动平均模型363
10.1.4ARIMA模型365
10.1.5ARIMA模型的R语言实现367
10.1.6R语言forecast包的应用373
10.2门限自回归模型376
10.2.1TAR模型的基本原理376
10.2.2TAR模型的R语言实现377
10.2.3R语言TSA包的应用380
10.3 GARCH模型族382
10.3.1线性ARCH模型382
10.3.2GRACH模型383
10.3.3EGARCH模型384
10.3.4Power ARCH模型384
10.3.5PARCH模型的R语言实现385
10.3.6R语言fGarch包的应用395
10.4向量自回归模型398
10.4.1VAR模型基本原理398
10.4.2VAR模型的R语言实现399
10.4.3R语言vars包的应用403
10.5卡尔曼滤波器算法405
10.5.1Kalman滤波算法初步406
10.5.2Kalman滤波的R语言实现407
10.5.3R语言FKF包的应用409
第三部分预测应用篇
第11章短期日负荷曲线预测414
11.1电力行业负荷预测介绍415
11.2短期日负荷曲线预测的基本要求415
11.3预测建模准备416
11.3.1基础数据采集416
11.3.2缺失数据处理及平滑418
11.3.3潜在规律分析421
11.4基于RBF神经网络的预测426
11.4.1RBF网络结构设计426
11.4.2确定*优参数427
11.4.3建模并实现预测431
11.4.4效果评估433
11.5基于LS-SVMR算法的预测435
11.5.1确定*优参数436
11.5.2建模并实现预测438
11.5.3效果评估439
第12章股票价格预测442
12.1股票市场简介443
12.1.1股票的基本概念443
12.1.2股票市场常用术语443
12.1.3股价波动的影响因素447
12.2获取股票数据452
12.3基于VAR算法的预测455
12.3.1平稳性检验455
12.3.2VAR模型定阶456
12.3.3预测及效果验证457
参考文献459信息

R语言预测实战 相关资料

本书对基于R语言的预测进行了非常深入和全面的讲解,从理论到算法,从应用到案例。本书从入门级开始逐渐深入,适合不同阶段和层次的读者,深入浅出,通俗易懂,是一本难得的好书。
——李成华,飔拓科技董事长兼CTO,曾任京东DNN实验室首席科学家R语言是一种功能强大且免费开源的语言,目前市场上以讲解R语言工具、统计、数据挖掘、数据分析的居多,系统地讲解预测专题的很少,本书涵盖方法、理论、实战,非常适合从事预测、机器学习的朋友阅读。
——张旋,乐视体育CTO一本数据实战工作者真正需要的书,作者直指预测这一最具挑战性的主题,用丰富的经验和优美的语言如抽丝剥茧般说清楚了很多问题,非常不错。
——李舰中科九峰智慧医疗 CTO

R语言预测实战 作者简介

游皓麟,高级数据分析师,目前专注于NLP、知识图谱以及深度学习的研究与实现。曾服务于华为技术软件有限公司等企业,多次出席R语言会议并发表演讲,在小象学院担任过R语言数据挖掘和机器学习讲师。

相关推荐

微信二维码