《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《别具光芒:Flash动感网站设计与制作》是一本专门介绍Flash网站设计与制作的图书,通过生动、实用的案例向读者全面展示动感网站制
《学习脑:像训练肌肉一样训练大脑》内容简介:你知道吗:做总结、做标记、图形记忆、重复阅读—这些我们从小就在使用的学习方法都
《想象的世界》内容简介:从使用版画的角度探讨版画艺术的可能性。书籍内容包括中央美院版画系第六工作室成立的缘起、发展历程、课
《现代电信百科》是一部电信专业普及读物。本书正文由基础知识篇、技术业务篇、经营管理篇和时尚未来篇等四部分组成,内容涵盖现
《格言联璧》内容简介:本书是清人金缨辑录的一部格言集成。金缨,字兰生,清朝道光、咸丰时人,他遍览群书,凡遇名言佳句便记录下
罗刚君编著的《ExcelVBA程序开发自学宝典(第2版)》是VBA入门的经典教材,对VBA的基础理论、语法规则、代码优化、编写思路、开发
《儿童发育迟缓居家康复指导》内容简介:本书从什么是发育迟缓、怎么知道得了发育迟缓、发育迟缓有哪些表现和危害、如何进行居家康
计算机应用基础// 本书特色 本书系统全面的介绍了计算机基础知识、windows xp操作系统、word 2003应用、excel 2003应用、powerpo...
《白居易诗选》内容简介:白居易是唐代的诗作大家,是中国诗史上的难得的诗人。本书是其诗作的精品选粹,收入诗近200首,都是流传久
本集基本上以时序发展为排列次序,主要反映从1919—1949年三十年间书籍装帧的发展脉络。我没有资格研究美术或书籍装帧艺术史,至
《DirectX9.03D游戏开发编程基础》主要介绍如何使用DirectX9.0开发交互式3D图形程序,重点是游戏开发。全书首先介绍了必要的数学
《我的小小团》内容简介:“烽火少年”系列讲述了发生在一群抗日儿童团成员身上的故事,以儿童的视角,描绘抗日战争期间发生在战地
Devicedriversliterallydriveeverythingyoureinterestedin--disks,monitors,keyboards...
《不懂财报就当不好经理》内容简介:随着市场经济的快速发展,无论是企业经营者还是普通职员,读懂财务报表都是一件非常有必要的事
《跨海之战》内容简介:金门、海南和一江山三次跨海之战经历了一个相当复杂的过程。以三次战争为线索,体现国共双方在战略方针的较
《捉虫日记》由克莱恩所著,《捉虫日记》从实践角度介绍安全漏洞,描述了作者在过去几年里怎样发现漏洞、怎样利用漏洞来攻击以及
网站运维工作,一向以内容繁杂、覆盖面广著称。《网站运维技术与实践》选取日常工作涉及的监测调优、日志分析、集群规划、自动化
《智能风控:原理、算法与工程实践》内容简介:本书以Python作为实现智能风险管理的编程语言,而我个人也十分推崇运用Python分析金
全书共分8章,分别介绍了基于规则的知识系统,人工神经网络,适应性智能系统,农业专家系统,知识管理与知识服务,智能机器人,人
《异质性的对话》内容简介:本书基于对“独立动画”的一般界定而展开,分析独立动画如何通过媒介实验与多层面批判确立自身,一方面