GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤

GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤

最近,GitHub官方公佈了2018年度機器學習排行榜,公佈了最受歡迎的十大語言、十大軟件包和十大項目。

排行榜是GitHub官方把2018年1月1日-2018年12月31日的數據扒了一下,通過計算上傳代碼、issue和PR的數量及評論數、PR review的數量排序計算出來的。

熱門的語言Python、熱門的框架TensorFlow都毫無疑問站在了第一名,不過令人詫異的是,PyTorch居然落榜了。

官方確定不是在搞笑?


語言:還是要學Python


GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤


通過查看帶“機器學習”標籤的項目貢獻者的存儲庫,官方給存儲庫裡最常見的語言進行了排名。

第一名毫無疑問是Python,Python在GitHub全站也非常熱門,排名第三,僅次於JavaScript和Java。

其他的機器學習常用語言則有C++、JavaScript、Java、C#、Shell和TypeScript,對比下面這張全站語言排行榜,會發現它們在GitHub全站也是前十名的佼佼者。


GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤


另外,Julia、R和Scala雖然在全站榜上無名,不過在機器學習榜倒是進了前10,Julia和R都是數據科學家常用的語言,Scala在Apache Spark等大數據系統交互時十分常用。


天下四分,Numpy有其三


GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤


軟件包榜單是GitHub官方從依賴圖中計算機器學習或數據科學項目的Python包百分比數據。

其中,第一名的Numpy是一個支持多維數據數學運算的軟件包,將近四分之三的機器學習和數據科學項目都用到了它;

Scipy,一個用於科學計算的軟件包;

Pandas,用來管理數據集的軟件包;

Matplotlib,一個可視化的庫,超過40%的機器學習和數據科學項目都在使用;

Scikit-learn也是一個非常流行的機器學習軟件包,包含大量機器學習算法的實現,近40%的項目在用它;

TensorFlow的使用率倒沒那麼高,大約只有不到1/4的包在用。

前十名裡,剩下的都是實用軟件包,Six是Python 2 和Python 3的兼容性庫,Python-dateutilpytz是用於處理日期的包。


PyTorch失蹤了


GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤


而在機器學習項目排行榜上,TensorFlow當之無愧排第一,貢獻者的數量是第二名Scikit-learn的兩倍。

第三名spaCy和第九名rasa_nlu是兩個NLP項目。

第四名Julia,作為2018年橫空出世的新語言在項目榜上排第四。

第五名openpose、第七名darkflow、第八名face_recognition和第十名tesseract,主要是圖像處理領域。

可是,廣受喜愛的PyTorch卻在這個榜單上失蹤了,原來——

PyTorch壓根沒給自己打上機器學習的標籤。


GitHub發佈年度機器學習榜:TensorFlow最火,PyTorch失蹤


不知道現在哭還來不來得及……


機器學習,秀翻GitHub

即使在GitHub全站,機器學習相關項目也十分火熱。去年10月的GitHub 2018年度榜單發佈後,官方就注意到了機器學習相關項目的超高存在感:

· TensorFlow是貢獻最多的項目之一;

· PyTorch是增長最快的項目之一;

· Python是第三熱門的語言;

也難怪要專門把機器學習拎出來列個排行榜了。

榜單地址:

https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/

作者系網易新聞·網易號“各有態度”簽約作者

七月在線給大家送春節福利嘍

10萬現金紅包天天發,助你“薪”年紅到底

精品好課砍破底價,助力職場絕地出擊


分享到:


相關文章: