《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《中国政党学说文献汇编(第三卷)》内容简介:第三卷收集的是1930—1949年间中国政党理论的文献资料。以编者查阅的国内报刊篇章、
《大数据智能核心技术入门》内容简介:本书跟从大数据和人工智能应用的融合之路,通过分析和解读整个数据驱动智能核心技术,希望能
《HTML5游戏开发实战》是一本经典的HTML5游戏开发教程,它清晰而全面地展示了如何使用最新的HTML5和CSS3标准来构建各种常见类型的
本书共分10章,除了第1章的通信系统概论之外,余下的章节主要介绍通信的信息理论和传输理论,内容包括:通信的信息理论基础、通信
本书从游戏是怎样一个行业到游戏业中形形色色的人;从细琐的技巧和算法,到游戏的结构和架构;从调试技巧到进度里程碑的创建和项
想象你正在攀登一座名为“软件开发”的山峰。本书是与你同登一座山峰的敏捷先驱所带来的话语与图片。他在崎岖的山路边找到相当平
本书通过分析9类质感表现的特点,向读者介绍了利用Illustrator进行绘画的技法。这9类质感包括传统美术作品质感、人体质感、动物质
《改变中国:经济学家的改革记述》内容简介:40年多来,中国经济所经历的巨变包含了太多引人入胜的故事。本书以一位经济学家的视角
photoshop cs5入门与提高 本书特色 本书从实用的角度出发,全面、系统地讲解了photoshopcs5的所有应用功能,基本涵盖了photoshopcs...
《中国精神读本》内容简介:☆权威编委:王蒙领衔的强大编委团队,汇聚国内杰出人文学者 ☆精心选篇:遴选中国近代以来百余篇传世名
TableofContentsPart1:AnIntroductiontoD31AnintroductiontoD3.js2InformationVisuali...
《典藏:经典世界名画高清图集》内容简介:了解艺术史,最直观的方法就是去欣赏艺术作品。本书集结了中世纪以来艺术史上各流派的经
本书专注于CSS技巧实例的讲解,由浅入深地分析了CSS样式在布局时所需要理解的原理。放弃到处可见的基础知识、网络中能随意搜索到
靳埭强1942年生于广东番禺,1957年定居香港,1964年开始研习艺术与设计,1967年开始设计工作,获奖无数。靳氏于1969年开始水墨创
《城市中国的逻辑》内容简介:中国模式或中国经验是近期的热议话题,关于改革开放三十年来中国的“经济奇迹”和“体制奇迹”,国际
《水之焰(2020版)》内容简介:女人不做恶女,就没法生存下去? 人妻盐川信子端庄贤淑,是位标准的传统女性,然而丈夫盐川弘治却早
《著作权合理使用制度研究(第三版)》内容简介:合理使用是现代著作权法中的一项重要制度,在著作权研究中被美、日学者称为世界性
《肌肉训练实战宝典》内容简介:《肌肉训练实战宝典》是专为期望快速训练肌肉的读者所设计的入门级图书。通过专业教练的详细演示,
《出版理论与实务研究(2022)》内容简介:《出版理论与实务研究2022》全书分为“出版工作”“选题策划”“书稿审读”“市场营销”
ARM嵌入式应用技术基础 本书特色 本书与《ARM嵌入式接口技术应用》、《ARM嵌入式应用实战》组成一个小系列,是以ARM7内核处理器和uC/OS.Ⅱ嵌入式操作...