天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

2019年天貓雙十一剛剛過去,其成交額又創歷史新高,達到2684億元。有人就用天貓連續10年的成交額做了一個迴歸分析,神奇的是,發現數據竟完美的符合三次迴歸曲線,小編很是好奇這個迴歸分析是怎麼做的呢?其實excel就可以做這種迴歸分析。


天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

天貓雙十一

點與線的關係

我們其實可以將回歸分析理解為點與線的關係,就以天貓雙十一成交額的數據為例。查閱資料,將數據整理如下表。

天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

成交額數據

以上就是天貓雙十一歷年的成交額數據,現在把這些數據畫到二維座標裡面。小編覺得python確實用起來挺方便,以下就是小編使用python的matplotlib模塊畫的散點圖。

天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

天貓雙十一歷年的成交額數據

那麼現在的任務就是要在這個二維平面上畫一條光滑的曲線,使得所有的點儘可能的都落到這條曲線上,並且告訴我這是一條什麼曲線,這個過程可以形象地理解為迴歸分析。初一想,可能不好解決,但,其實excel就可以處理簡單的這類問題。在excel中為雙十一的數據添加散點圖,並且為散點圖添加趨勢,多項式中選擇三階項式,最後顯示公式和顯示R平方值。

天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

添加曲線的趨勢

就可以看到曲線的上方出現擬合的公式以及R的平方值。R的平方值最大值為1,其值越大說明擬合的程度越高,這裡的R平方為0.9996,並且肉眼觀察到所有的點都處於曲線上。

天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

三次擬合曲線

數學原理

對於這種線性迴歸問題可以採用最小二乘法來解決,假設離散點符合f(x)=ax^3+bx^2+cx+d,將n個二維座標點的x帶入f(x)將得到n個f(x)的值,將其與二維座標中的y值做一個差平方,並求和得到誤差平方和(所有點到直線上的誤差和)。

天貓累計成交額2684億,有人做了迴歸分析,竟完美匹配,怎麼做的

誤差平方和

我們想要平面上的點儘可能的在曲線上,也就是希望誤差平方和最小,於是將誤差平方和對f(x)中的a,b,c,d求偏導,令偏導等於零,求出a,b,c,d帶入f(x)表達式就求得了這條曲線。

線性迴歸分析的作用

線性迴歸分析主要是針對線性方程,對於非線性的方程,不能求得偏導,無法繼續求得參數。線性迴歸分析可以用來確定模型參數,比如人體電阻與人體成分之間存在一定的線性數學模型,但是模型中的某些參數未知,那麼就可以去採集許多組數據,進行線性迴歸分析確定參數。數學模型確認之後就可以進行預測,下一次有人測了一次人體電阻,我就可以預測他的人體成分,就是這麼神奇,甚至我可以預測一下2020年的雙十一的成交額。

喜歡我的話,加個關注吧,有更加精彩的內容等著大家。


分享到:


相關文章: