今天在最基礎的內容上坑了大半天,怎麼也想不明白為啥跟官方答案對不上
![R語言——幾個基礎統計](http://p2.ttnews.xyz/loading.gif)
晚上10點三刻開始碼字,離上床睡覺的時限還有一刻鐘,嗚嗚嗚~~
#讀取數據
Test
![R語言——幾個基礎統計](http://p2.ttnews.xyz/loading.gif)
共12列,其中前11列都是數值,第12列是目標變量,目前還沒做分類,所以最後一列不要
然後,按要求先做個summary,由於summary函數的默認輸出樣式不太方便做後續處理,我決定拆分成單列再用apply整合
T1 #數值型變量Summary整理格式
Summarize S1 if (length(S1) ==6){
S1 return(S1) }
#代入數據
So Titles SumOrigin
輸出的SumOrigin如下,看起來還可以:
#缺失行分隔:
Rna Known
缺失數據的行有將近20%,又得哭一會~~~~
#離群值修正
#+/-1.5倍四分位距
L1 H1 #+/-3倍標準差
SD1 L2 H2 library("timeDate")
#峰度
Kt #偏度
SK #集中以上數據
Range
上邊的L1、H1和L2、H2是用兩種方式計算出的每列數據範圍上下限
Kt為峰度,>0時為尖峰,<0時為扁平峰
SK為偏度,>0時右偏,<0是左偏
超時5分鐘,挑戰失敗~~~~~
閱讀更多 jennifer5jl 的文章