R语言——数值预测的一些评价指标

今天内容少,也不打算上实例,勉强算理一理知识点吧

R语言——数值预测的一些评价指标

当预测的数列本身是个分类型数据时,评价预测结果好与不好可以用混淆矩阵及其相关的那些个指标,像正确率、查全率、F-指标什么的

而当预测的是个连续型变量时,也会有几种不同的评价方式

1) 相关性,函数cor或cor.test,这恐怕是最常用的一种了

输入对象是预测列和实际值

可以通过其参数method = c("pearson", "kendall", "spearman")来选择考察不同的相关性,默认的是pearson,表示线性相关

2) 检验残差是否白噪声,函数Box.test

输入对象是拟合后的残差列

设置参数type = "Ljung-Box",按R软件的示例,此处还能简写成type = "Ljung"

R语言——数值预测的一些评价指标

3) 检验残差自相关性,函数acf

输入对象残差列

k完代码回车后会自动出自相关函数图,此方法不仅能用于拟合,在时间序列上也能用

acf(x)

R语言——数值预测的一些评价指标

捎带提下另外两个,偏自相关函数pacf和互相关ccf,其中互相关是需要输入x、y两个向量的,产生的图原点在中间,左右对称,当ccf的两个向量相同时,图形右边一半和acf输出的数值相同

pacf(x)

R语言——数值预测的一些评价指标

有图没数不行星人可以在代码外边套层print或者在后边添加个小尾巴$acf,上边仨函数都适用这个小尾巴,但请注意输出形式是list

4) 检验残差是否有异方差性,函数gqtest,属于lmtest包

这个函数主要使用于线性回归,所以输入对象要求是y~x的公式接口或lm函数产生的线性模型

R语言——数值预测的一些评价指标

5) 检查自变量是否有多重共线性,函数vif,属于car包

这里有两个tip:首先,VIF是有正式术语的,叫方差膨胀因子

其次,car这个包网络连接不好时可能会有点难装,因为它的外部依赖包有一大堆,属于是网速慢时可以起身去上个洗手间的那种

输入对象支持lm或glm的拟合模型

R语言——数值预测的一些评价指标

一般认为VIF值大于10就可能存在共线性,大于100那就严重共线了

整理完毕~~


分享到:


相關文章: