65.9K
CodeProject 正在变化。 阅读更多。
Home

用 R 进行线性模型固定效应

starIconstarIconstarIconstarIcon
emptyStarIcon
starIcon

4.06/5 (3投票s)

2015年12月20日

CPOL

3分钟阅读

viewsIcon

7491

线性模型是解释生物学或社会科学中观察到的数据的有力工具。

引言

什么是线性模型?

假设你有一个实验,想了解人类的身高随着年龄的增长而变化的情况。你选择不同年龄段的人,不考虑他们的性别、种族等因素。因为你只想知道年龄对身高增长的影响。因此,你将得到一个模型,它表明人类身高增长的模式。

由于现实世界并非总是确定的,并且存在例外情况。在这个例子中,还有其他因素可能会干扰结果。例如,性别、种族是我们在计算中不想考虑的因素。这里“身高”是因变量,因为它基于“年龄”进行测量,而“年龄”被称为自变量、预测变量或固定效应。线性模型固定效应的公式是

身高 ~ 年龄 + 误差

误差包括所有可能影响结果但我们不了解或故意/不故意不考虑的其他因素和参数。

年龄(cm)   身高

55              5

15              120

20              170

25              175

线性模型向我们展示了年龄和身高之间的关系和相关性,但我们必须考虑误差,因为如果加入种族和性别参数,结果会发生变化。有些样本由于性别或种族而较矮或较矮。

 

安装 R

R 是一款适合进行统计计算的软件,并且可以绘制出对我们理解变量及其关系产生巨大影响的适当图形。第一步是访问 https://cran.r-project.cn/bin/windows/base/ 并根据你的操作系统安装合适的版本。

如果你使用 Windows,请选择下载 R 3.2.3 for windows

 

现在启动 R 以输入命令并创建统计解释和图形。

使用代码

现在在命令行中

身高 = c(55, 120, 170, 175)

年龄 = c(5, 15, 20, 25)

mydf=data.frame(年龄, 身高) --> “data.frame”会将两个变量分配并组合在一起。

mymodel = lm(身高~年龄, mydf) --> “lm”是线性模型命令

summary(mymodel) --> “summary()”生成关于数据的有价值的信息。

 

残差:

残差是身高实际值与预测线之间的差异。

 

命令 "Plot(年龄, 身高)" 可以绘制散点图,如下所示

而 Plot(mymodel) 具有关于我们模型的更有意义的图形。

 

截距

截距是当 X 或“年龄”为 0 时 Y“身高”的平均值,如果 X 不能为零,则截距没有意义。

多重 R 平方

R 平方表示我们有多少方差,而调整后的 R 平方表示有多少固定效应。

P 值

P 值表明我们的固定值是否对我们的模型有影响。

 

Hist(residuals(mymodel)) --> 绘制模型的直方图

 

qqnorm(residuals(mymodel)) --> 是残差的正态概率图,它将我们的数据集与正态分布进行比较。

 

 

历史

初稿日期:2015 年 12 月 20 日。

© . All rights reserved.