《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
本书由资深Python专家亲自执笔,Python语言的核心开发人员作序推荐,权威性毋庸置疑。对于程序员而言,标准库与语言本身同样重要
诠释价值万亿的商业生活新事实顺势重构既有的造富大趋势★“一带一路”、亚投行、丝路基金等重磅战略无一例外地指向中国西边,全
学术理论研究著作集萃.理工学科:基于本体数据库的多标签预测模型及生物医药数据挖掘研究 内容简介 《基于本体数据库的多标签预测模型及生物医药数据挖掘研究》共9章。...
《西北断简》内容简介:本书是朱幼棣先生在20世纪末的数年里完成的旅行文集。他在各地任职、考察期间,从西北到晋陕,用自己的双脚
《信托的未来》内容简介:全面剖析中国信托业未来发展趋势与转型方向在中国金融行业中,信托一直是一个较为特殊的存在。过去十年,
《茅理翔:创业式传承》内容简介:家族企业的传承已经成为民企发展过程中的一道难题,方太集团茅氏父子用自己的人生经验和智慧,给
《世界前沿技术发展报告2020》内容简介:本书于2020年年初编纂,总结了2019年的技术,并对2020年的发展态势做了预判。书中详细介绍
《美如初见:护肤的真相》内容简介:作者叶剑清是大学教授,也曾为多家知名化妆品企业做过专业咨询,对化妆品的配方有深入研究,也
《CPU自制入门》内容简介:本书教读者制作原创的计算机系统。第1章以介绍CPU为主,同时介绍如何制作存储程序与数据的内存、输入与输
Visual Basic 6.0基础与实践教程 内容简介 本书由浅入深,针对Visual Basic,系统地讲解从基本的语言元素知识点到构建一个具体完整的实用系...
《信息时代的世界工厂》,最关切我们未来的“思想@网络.中国”丛书之一,互联网中国传媒参考书。我们生活在“信息时代”。我们的
《常春藤英语(精编版·六级)》内容简介:本书根据《常春藤英语·六级(上下)》两本书进行修订,从中选取难度相对较低的文本,并
简言之,是一个人和一本杂志的传奇……放在大环境中,是一个时代的跌宕起伏……一直大力地向所有人推荐这本书,只是因为,故事真
《计算机科学概论(Python版)》内容简介:本书是美国哈维玛德学院“计算机科学通识”课程的配套教材,用独特的方法介绍计算机科学
本书由浅入深,循序渐进地介绍了ASP.NET2.0的新技术,包括新控件、新功能和新的类。为了让读者全面地学习ASP.NET2.0,书中还讲到
《万历十五年欧洲那些事儿》内容简介:读者将读到的是一个个名垂青史的鲜明人物,一个个跌宕起伏的精彩故事。公元1587年,在中国为
《虚拟智能体理论与技术》内容简介:本书结合国内外虚拟现实技术的发展潮流,结合作者以往的研究基础,论述了建立智能体的理论、方
《卑鄙的圣人:曹操6》内容简介:一件件讲透,曹操收拾三国群雄的卑鄙、奸诈、狠毒计谋; 一页页浸透,曹操体恤天下众生的柔情、仁
《亚非诸国文学研究的学术历程》内容简介:本书是《中国外国文学研究的学术历程》总12卷之第12卷。本卷主要介绍亚非地区除日本、印
多媒体技术及应用(第2版) 本书特色 执考用书,14年经验指导,全面覆盖大纲,补充超纲考点。多媒体技术及应用(第2版) 内容简介 本书根据教育部高等学校文科计算...