热门

最新

红包

立Flag

投票

同城

我的

发布
2201_75349501
全面开花
3 年前
true2201_75349501

1. 相关系数(R)
定义:变量之间线性相关的度量。分三种,spearman, pearson, kendall
解释:自变量X和因变量Y的协方差/标准差的乘积。
* 协方差:两个变量变化是同方向的还是异方向的。X高Y也高,协方差就是正,相反,则是负。
* 为什么要除标准差:标准化。即消除了X和Y自身变化的影响,只讨论两者之间关系。
* 因此,相关系数是一种特殊的协方差。

2. 决定系数(R^2)
定义:对模型进行线性回归后,评价回归模型系数拟合优度。
解释:残差(residual):实际值与观察值之间的差异。
若,R^2=81%,因变量Y的81%变化由我们的自变量X来解释。
R^2 的缺陷:当我们人为的向系统中添加过多的自变量,SSE会减少,从而R^2变大。因此我们采用校正R方,惩罚了过多无意义的自变量。

参考:
https://www.jianshu.com/p/8aefd78be186

CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条:
费了不少力气,抓3个跑2个
立即登录