R语言线性回归怎么使用

73次阅读
没有评论

共计 1852 个字符,预计需要花费 5 分钟才能阅读完成。

这篇文章主要讲解了“R 语言线性回归怎么使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着丸趣 TV 小编的思路慢慢深入,一起来研究和学习“R 语言线性回归怎么使用”吧!

一、R 安装

R for Mac OS

RStudio

二、线性回归基础

eg1:

凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系。但是除此之外,还存在其他影响物理成绩的因素, 例如,,是否喜欢物理,用再物理学习上的时间等

eg2:

商品销售收入与广告支出经费之间的关系,商品销售收入与广告支出经费有着密切的联系。但是还有很多其他因素

eg3:

粮食产量与施肥量之间的关系。在一定范围内,施肥量越大,粮食产量就越高,但是施肥量并不是影响粮食产量的唯一因素。

年龄 23273941454950 脂肪 9.517.821.225.927.526.328.2 年龄 53545657586061 脂肪 29.630.231.430.833.535.234.6

人体的脂肪含量与年龄之间的有怎样的关系?

首先我们做散点图。以 x 轴表示年龄,y 轴表示脂肪。(自己做散点图,)

从散点图,可以看出,它们散布在从左下角到右上角的区域。对于两个变量的这种相关关系,我们称之为正相关。还有一些变量,例如汽车的重量和汽车每消耗 lL 汽油所行驶的平均路程,称为负相关。

从散点图可以看出,这些点大致分布在通过散点图中心的一条直线附近。如果散点图中心分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线称为回归直线 (regression line). 如果能够求出这条回归直线的方程 (回归方程),那么我们就比较清楚了解年龄与脂肪的关系。

最小二乘法

实际上,求回归方程的关键是如何用数学的方法刻画“从整体上看,各点到此直线的距离最小”

假设该直线为 y = bx + a

注意:

(x1,y1)(x2,y2)…(xi,yi).. 一个个点。到直线的距离,我们可以用点到直线的距离算出,但是这个比较复杂。

所以第一个简化 == 点 (xi,yi) , 垂直向上,或垂直向下到直线的距离  yi – y = yi – (bxi + a)

但是 yi – y 有正负之分,所以我们第二次简化,算平方

Q = (y1 – bx1 – a)^2 + (y2 – bx2 – a)^2 + …. + (yi – bxi – a)^2 + …

只要计算出使得 Q 的最小的 a 和 b,就能得到该回归方程。 

可以使用偏导数计算得出 a,b

a = …

b = …

b 是回归直线的斜率,a 是截距

相关关系的强弱

我们知道不是所有两个变量的关系都是线性的,如何判断是否能使用线性回归呢?

统计中用相关系数 r 来衡量两个变量之间的线性关系强弱。

r = …

统计学认为 如果 r – [-1,-0.75] 那么负相关很强,r – [-0.75,-0.30] 负相关性一般,r – [-0.25,0.25] 相关性弱,

 r – [0.75,1] 那么正相关很强,r – [0.30,0.75] 正相关性一般,

三、RStudio 测试

数据:

研究婴儿生理发育 issue,并收集了 10 名婴儿在出生后一年内的月龄和体重数据。

年龄 (月)01‍‍0305021109030912 体重 (kg)4.45.37.25.28.57.36.010.410.2‍

036.1

 我们用 c() 函数以向量的形式输入月龄和体重
  x_age=c(1,3,5,2,11,9,3,9,12,3)
  y_weight=c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)
  mean(y_weight) =   计算平均数
[1] 7.06
  sd(y_weight) =   计算标准差
[1] 2.077498
  cor(x_age,y_weight) =   计算相关性
[1] 0.9075655
  plot(x_age,y_weight) =   画散点图
  cor_xy = lm(y_weight~x_age + 1) =   设置拟合曲线方程式
  plot(cor_xy) =   画回归直线
  coef(cor_xy) =   计算回归直线的斜率和截距
(Intercept) x_age 
 4.3596206 0.4655827
 
  z = data.frmae(x_age=13) 
  predict(cor_xy,z) =   我们来预测 13 个月的婴儿的体重 

感谢各位的阅读,以上就是“R 语言线性回归怎么使用”的内容了,经过本文的学习后,相信大家对 R 语言线性回归怎么使用这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是丸趣 TV,丸趣 TV 小编将为大家推送更多相关知识点的文章,欢迎关注!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-16发表,共计1852字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)