臉書和 Social Science One 終於放出內含 3800 萬個網址的資料集

在 2018 年 7 月由非營利的美國社會科學研究協會(Social Science Research Council)及臉書(Facebook)共同成立的獨立組織 Social Science One,終於在本週放出內含 3800 萬個網址的資料集,號稱是全球規模最大的社會科學資料集之一,目的是供學者及研究人員用來探討社交媒體在選舉及民主上所扮演的角色。

此社會科學資料集內含臉書,從 2017 年 1 月 1 日到 2019 年 7 月 31 日之間,超過 100 次分享的 10 兆則摘錄資訊,涉及 3800 萬個網址,同時也備註了這些網址是否曾經過事實查核,或是被使用者列為仇恨言論等資訊,以及被哪類的使用者讀取、分享、點贊、分享或互動。

Social Science One 表示,此資料集將讓社會科學家得以取得過去他們無法存取的資料,藉以研究社交媒體對民主與選舉的影響。

其實 Social Science One 原本計劃要在宣佈的兩個月內就產出資料集,但後來卻花了 20 個月才完成,關鍵問題在於隱私。

參與此項目的斯坦福大學法學教授 Nathaniel Persily 透露,這是他這輩子所參與的項目中最令人感到挫敗的,2018 年 3 月爆發的劍橋分析(Cambridge Analytica)醜聞,讓臉書在處理用戶隱私上更加謹慎,2018 年 5 月上路的《通用資料保護規則》(GDPR),更讓該資料子集的建立雪上加霜。

這是因為 GDPR 在保護使用者隱私時,並未考量到研究人員存取用戶資訊的需求,且 GDPR 雖然制定了適用於歐盟的規範,但各國的執行標準不一。

臉書前任安全長 Alex Stamos 則指出,各監管機構對劍橋分析一案的反應過度,造成大量的學術研究無法運用這些平臺的資料。

不過,Social Science One 認為生產此資料集的過程還是有些收穫,至少可在其它平臺、政府與學術機構執行其它資料分享項目時作為參考。