來自「正義」程式設計師的反擊之 star 淨網行動

來自「正義」程序員的反擊之 star 淨網行動

導語:這是來自我們「正義」程序員的反擊,正義可能會遲到,但是從來不會缺席。

我記得從7月2號,我在公眾號上寫了一篇文章

《中國內地 GitHub 造假呈指數級增長,其背後是……》

爆料了 GitHub 上刷 star 的亂象,淘寶上竟然有公開代刷 star 和 fork 的,竟然明碼標價,再到 8 月 25 號我寫的文章

《GitHub 被國人玩出新高度,這是恥辱啊!》

,上面竟然發現 GitHub 賬號可以被交易,簡直刷新了我們的認知和新高度,GitHub 註冊日期越早越貴。雖然我在這兩篇文章上對此行為進行了強烈的抨擊,不僅僅是造假,更嚴重的問題是破壞了 GitHub 上的生態,以後真正好的開源庫和開源項目就很難分辨了。

但是,就在9月3號一篇文章《石錘 github 買 star 行為》火了,引起了大家的強烈討論和反應。文章中有理有據的對此行為進行了抨擊。但是這可能還不夠吧!

就在今天我瀏覽掘金社區的時候,竟然發現有人做了一個開源項目,並寫了一篇文章,叫:《GitHub 虛假 Star 淨網行動》,作者是

楊蕭玉。那我們就一起來看看這個開源項目的作者是如何利用技術來實現淨網行動的?

該開源項目的作者在文章中寫道:

這條黑產背後到底隱藏著什麼?GitHub 上還有哪些大笨蛋也曾靠買 Star 矇蔽了大神們的雙眼呢?我寫了個簡單的程序用於挖掘基於 Star 的關係鏈,並進行聚類分析。然後從 CocoaDebug 這個 repo 入手,沿著關係鏈一層層深挖下去。

所以作者,就有了淨網行動的思路,大致如下:

來自「正義」程序員的反擊之 star 淨網行動

利用的技術棧就是:python3 + GraphQL。大致內容如下:

來自「正義」程序員的反擊之 star 淨網行動

說簡單點就是作者用 Python 爬蟲技術,遞歸訪問每個用戶的 repo 庫的情況,進行數據分析及用戶關注情況,來作出判斷,是否有刷 star 和 fork 數的行為。

當然,是利用技術和數據進行分析,也會有分析錯的地方,所以結果並不一定非常準確,僅供參考,存在一定的誤判。

通過這個作者在文中的描述,可以知道,改開源項目的作者利用的技術都是現學現賣,應該是剛剛學習了該項技術,在這裡僅僅是做實驗,拿出來分享罷了。

看到這裡我不禁感慨,看看人家這位開源作者,再看看那些刷量,刷 star 的人,人家在學完技術的時候,利用技術做一些開源項目分享給大家,去淨網逮你們,而你們呢?培訓完編程,就知道去刷量,為什麼不實實在在的做個項目去提高自己呢?紮紮實實的提高技術才是真本事。

作為程序員就應該好好學習技術,利用技術,使用技術,技術本身就是單純的,程序員更單純。不要去做那些偷雞摸狗禍害程序員形象的行為。

最後,該開源項目的地址是:https://github.com/yulingtianxia/FuckFakeGitHubStars

而作者博客文章《GitHub 虛假 Star 淨網行動》的地址是:http://yulingtianxia.com/blog/2018/09/16/Fuck-Fake-GitHub-Stars/

關於該開項目的具體介紹和使用情況,請看原作者的博客文章。


分享到:


相關文章: