R語言——幾個基礎統計

今天在最基礎的內容上坑了大半天,怎麼也想不明白為啥跟官方答案對不上

R語言——幾個基礎統計

晚上10點三刻開始碼字,離上床睡覺的時限還有一刻鐘,嗚嗚嗚~~

#讀取數據

Test

R語言——幾個基礎統計

共12列,其中前11列都是數值,第12列是目標變量,目前還沒做分類,所以最後一列不要

然後,按要求先做個summary,由於summary函數的默認輸出樣式不太方便做後續處理,我決定拆分成單列再用apply整合

T1 #數值型變量Summary整理格式
Summarize S1 if (length(S1) ==6){
S1 return(S1) }
#代入數據
So Titles SumOrigin

輸出的SumOrigin如下,看起來還可以:

R語言——幾個基礎統計

#缺失行分隔:
Rna Known
R語言——幾個基礎統計

缺失數據的行有將近20%,又得哭一會~~~~

#離群值修正
#+/-1.5倍四分位距
L1 H1 #+/-3倍標準差
SD1 L2 H2 library("timeDate")
#峰度
Kt #偏度
SK #集中以上數據
Range
R語言——幾個基礎統計

上邊的L1、H1和L2、H2是用兩種方式計算出的每列數據範圍上下限

Kt為峰度,>0時為尖峰,<0時為扁平峰

SK為偏度,>0時右偏,<0是左偏

超時5分鐘,挑戰失敗~~~~~


分享到:


相關文章: