偶然之間,發現了一個網站,title 是世界銀行,很高級的樣子,可以下載很多有趣的數據,這對於我們練手數據分析及可視化真的是太好的資源了,不多說,戳下面的鏈接可以火箭直達哦!
https://data.worldbank.org/
我從該網站上下載了世界各國曆年的 GDP 總值和增長率數據,下面就摩拳擦掌,一探 GDP 的世界!
數據文件分析
先來看下我們拿到的文件,都有什麼數據,哪些是我們可以利用起來的。
GDP 總量數據,這是我們研究的重點數據文件,裡面囊括了世界各個國家和地區的歷史 GDP 數據,我把它命名為“GDP_data.csv”。
GDP 增長率數據,這個同樣是非常重要的數據文件,記錄了各國 GDP 的增長率情況,我把它命名為“growth_data.csv”。
國家收入分類數據,該數據文件把各個國家分類成不同等級的收入階層,比如有“高收入國家”,“低收入國家”等等,我把它命名為“Country_data.csv”。
國家 Code 對照表,這是一個國家英文名稱和 Country Code 的對照表,我們後面在繪製地圖時會使用到。
各個收入等級分析
各個收入等級分佈
首先我們先來看下世界各國分佈在不同收入等級的情況
可以看到,處於“高等收入”和“低收入”的國家比例差距還是很大的,在二十一世紀的今天,還有太多的人過著食不果腹、衣不保暖的生活。
下面我們再具體看下不同收入等級中各個國傢俱體的 GDP 總量
高收入國家
首先是高收入國家 top10 的 GDP 總量
我們首先拿到高等收入的國家信息,再與 gdp 信息數據合併,最後得到 top10 數據
# 高收入國家2018年的GDP
high = country_data[country_data['Income_Group'] == '高收入國家']
high_gdp = pd.merge(high, gdp, how='inner')
high_gdp['2018'] = high_gdp['2018'].apply(lambda x: x/1000000000000)
high_gdp_top10 = high_gdp[['Country Name', 'Country Code', '2018']].sort_values(by='2018', ascending=False)[:10]
可以看到,美國是一騎絕塵,排在後面的小弟們,總量加一起也沒法和美國相提並論。而在前十名當中,幾乎清一色的歐美髮達國家。
我們再把榜單擴展到 top20,能看到,歐洲國家還是居多的,而中東的兩個土豪也成功上榜了。
最後再來看下美國佔據全世界 GDP 總量的百分比情況
看圖不說話。
中等收入國家
接下來看看中等收入國家的 top10 情況
基本上都是發展中大國,其中還不乏南非、阿根廷等即將成為發達國家的選手。而我國則以13.6萬億的總量,成為美國之後另一個巨無霸般的存在。
來看看中美兩個總體上佔據世界 GDP 的比例情況
毫無疑問,這兩個 GDP 總量佔去世界 GDP 總量40%的國家,絕對是世界經濟的命脈,相互合作,攜手共贏才是世界經濟的未來!
再來看下 top20 的情況
中低等收入國家
下面就是中低等收入的國家了,還是有很多熟悉的面孔啊
在這個級別當中,亞洲國家佔據了大多數,但是 GDP 的總量卻不是很低,尤其是印度,有2.7萬億的數量。這也能反映出,亞洲作為世界上人口最多的大洲,要走向發達國家的行列,還是任重道遠啊!
top20 情況
低收入國家
最後就是低收入國家了,可以看到,在這些國家中,要不就是戰亂頻仍的國度,要不就是資源匱乏的小國,他們的經濟建設之路還很漫長呢。
top20 的情況
GDP 總體排行
2018年 GDP 排行
先來看看2018年 GDP 總體排行的 top10 吧
可以看到,除了歐美諸強之外,中國、印度和巴西也紛紛上榜,發展中大國的實力不容小覷啊。
那麼再來看看 GDP 總量倒數的10個國家呢
都是一些不大的國家,差距還是太大了!
歷年各國 GDP 走勢
我們先來看一下 GDP 總量排行前五的國家,歷年 GDP 總量的走勢情況
美國
中國
日本
德國
英國
可以看出,除了中美兩國外,其他的國家 GDP 總量都出現過大幅度的波動情況,而持續增長的中美兩國,則一騎絕塵,遙遙領先於世界了!
世界 GDP 地圖
下面我們通過世界地圖的方式來看看 GDP 的分佈情況
我們先進行數據處理,把國家代碼和 GDP 數據相結合
country_code = pd.read_json('countries.json')
country_code.rename(columns={'iso3': 'Country Code'}, inplace=True)
conutry_code_name = country_code[['name', 'Country Code']]
country_gdp_code = pd.merge(country_gdp, conutry_code_name, on='Country Code', how='inner')
由此,我們可以做出一張 GDP 總量的地圖分佈圖
在這張 GDP 地圖中,可以清晰的看出,美國和中國地盤大,顏色深,非常明顯,隱隱有東西兩強的趨勢。
我們再去掉中美兩國,看看剩餘國家的 GDP 情況
在這張圖中,可以看到日本、西歐和印度是一個級別的存在,而俄羅斯、加拿大、澳大利亞和巴西等是另外的一組,其餘大部分的第三世界國家,則是第三組!
GDP 增長率
下面我們再來看看 GDP 增長率的情況,有的國家 GDP 本來總量就高,而且增長率還非常不錯,那麼未來的經濟形式一定前途無量;而有的國家則舉步維艱,低 GDP 總量再加上慘淡的增長率,未來的日子很難啊。
增長率 top10
在這份增長率 top10 榜單中,大部分的國家都是 GDP 較低的國家,這還是說明低 GDP 的增長空間是更加大的。
而印度則不一樣,它本身的 GDP 總量已經非常高了,竟然還有這麼高的 GDP 增長率,其未來的經濟一片大好啊!
增長率 bottom10
再來看下增長率排名墊底的10個國家,這就比較鬧心了
GDP 負增長就是說經濟在後退啊,如何振興經濟應該是這些國家的首要任務了!
中美印對比
在圖中可以看出,雖然近些年印度保持著很高的增長率,但是 GDP 總量增長並沒有中美兩國明顯。
而美國的增長率常年在2%和1%之間震盪,好像還蠻有規律的。
對於我國來說,增長率已經從以前恐怖的10%慢慢回落了,但是經濟增長的趨勢是沒法阻擋的!
增長率地圖
最後還是在世界地圖中整體看看 GDP 增長率的分佈情況
總體來說,大部分國家的增長率都處於1%-4%的水平之間,而中亞和東南亞的部分國家可以保持增長率在4%-7%之間,只有極少部分國家能夠達到7%以上的增長率,不過對於阿根廷來說,刺眼的負增長還是驚心的,這麼多年了,經濟還沒有復甦的跡象嗎?
最後,我們以一段 GDP 排行視頻來結束今天的分享吧
視頻是根據如下工具製作的,喜歡的可以自己動手嘗試下
https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js
【年薪30w工程師吐血整理資料大合集】
領取IT資料大合集:http://image.qbangmang.com/counselor.html
閱讀更多 馬哥Linux 的文章