今天内容少,也不打算上实例,勉强算理一理知识点吧
当预测的数列本身是个分类型数据时,评价预测结果好与不好可以用混淆矩阵及其相关的那些个指标,像正确率、查全率、F-指标什么的
而当预测的是个连续型变量时,也会有几种不同的评价方式
1) 相关性,函数cor或cor.test,这恐怕是最常用的一种了
输入对象是预测列和实际值
可以通过其参数method = c("pearson", "kendall", "spearman")来选择考察不同的相关性,默认的是pearson,表示线性相关
2) 检验残差是否白噪声,函数Box.test
输入对象是拟合后的残差列
设置参数type = "Ljung-Box",按R软件的示例,此处还能简写成type = "Ljung"
3) 检验残差自相关性,函数acf
输入对象残差列
k完代码回车后会自动出自相关函数图,此方法不仅能用于拟合,在时间序列上也能用
acf(x)
捎带提下另外两个,偏自相关函数pacf和互相关ccf,其中互相关是需要输入x、y两个向量的,产生的图原点在中间,左右对称,当ccf的两个向量相同时,图形右边一半和acf输出的数值相同
pacf(x)
有图没数不行星人可以在代码外边套层print或者在后边添加个小尾巴$acf,上边仨函数都适用这个小尾巴,但请注意输出形式是list
4) 检验残差是否有异方差性,函数gqtest,属于lmtest包
这个函数主要使用于线性回归,所以输入对象要求是y~x的公式接口或lm函数产生的线性模型
5) 检查自变量是否有多重共线性,函数vif,属于car包
这里有两个tip:首先,VIF是有正式术语的,叫方差膨胀因子
其次,car这个包网络连接不好时可能会有点难装,因为它的外部依赖包有一大堆,属于是网速慢时可以起身去上个洗手间的那种
输入对象支持lm或glm的拟合模型
一般认为VIF值大于10就可能存在共线性,大于100那就严重共线了
整理完毕~~
閱讀更多 jennifer5jl 的文章