最近,GitHub官方公佈了2018年度機器學習排行榜,公佈了最受歡迎的十大語言、十大軟件包和十大項目。
排行榜是GitHub官方把2018年1月1日-2018年12月31日的數據扒了一下,通過計算上傳代碼、issue和PR的數量及評論數、PR review的數量排序計算出來的。
熱門的語言Python、熱門的框架TensorFlow都毫無疑問站在了第一名,不過令人詫異的是,PyTorch居然落榜了。
官方確定不是在搞笑?
語言:還是要學Python
通過查看帶“機器學習”標籤的項目貢獻者的存儲庫,官方給存儲庫裡最常見的語言進行了排名。
第一名毫無疑問是Python,Python在GitHub全站也非常熱門,排名第三,僅次於JavaScript和Java。
其他的機器學習常用語言則有C++、JavaScript、Java、C#、Shell和TypeScript,對比下面這張全站語言排行榜,會發現它們在GitHub全站也是前十名的佼佼者。
另外,Julia、R和Scala雖然在全站榜上無名,不過在機器學習榜倒是進了前10,Julia和R都是數據科學家常用的語言,Scala在Apache Spark等大數據系統交互時十分常用。
天下四分,Numpy有其三
軟件包榜單是GitHub官方從依賴圖中計算機器學習或數據科學項目的Python包百分比數據。
其中,第一名的Numpy是一個支持多維數據數學運算的軟件包,將近四分之三的機器學習和數據科學項目都用到了它;
Scipy,一個用於科學計算的軟件包;
Pandas,用來管理數據集的軟件包;
Matplotlib,一個可視化的庫,超過40%的機器學習和數據科學項目都在使用;
Scikit-learn也是一個非常流行的機器學習軟件包,包含大量機器學習算法的實現,近40%的項目在用它;
TensorFlow的使用率倒沒那麼高,大約只有不到1/4的包在用。
前十名裡,剩下的都是實用軟件包,Six是Python 2 和Python 3的兼容性庫,Python-dateutil和pytz是用於處理日期的包。
PyTorch失蹤了
而在機器學習項目排行榜上,TensorFlow當之無愧排第一,貢獻者的數量是第二名Scikit-learn的兩倍。
第三名spaCy和第九名rasa_nlu是兩個NLP項目。
第四名Julia,作為2018年橫空出世的新語言在項目榜上排第四。
第五名openpose、第七名darkflow、第八名face_recognition和第十名tesseract,主要是圖像處理領域。
可是,廣受喜愛的PyTorch卻在這個榜單上失蹤了,原來——
PyTorch壓根沒給自己打上機器學習的標籤。
不知道現在哭還來不來得及……
機器學習,秀翻GitHub
即使在GitHub全站,機器學習相關項目也十分火熱。去年10月的GitHub 2018年度榜單發佈後,官方就注意到了機器學習相關項目的超高存在感:
· TensorFlow是貢獻最多的項目之一;
· PyTorch是增長最快的項目之一;
· Python是第三熱門的語言;
也難怪要專門把機器學習拎出來列個排行榜了。
榜單地址:
https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/
作者系網易新聞·網易號“各有態度”簽約作者七月在線給大家送春節福利嘍
10萬現金紅包天天發,助你“薪”年紅到底
精品好課砍破底價,助力職場絕地出擊
閱讀更多 七月在線 的文章