在百度搜索部分小學和幼兒園,會被導向色情網站

在百度搜索部分小学和幼儿园,会被导向色情网站

科技

前兩天,一位廣州的家長在微博上發來私信,他發現:在百度中搜索廣州的很多小學和幼兒園的名字,結果中排在首位的一般都是百度百科,而進入百度百科頁面之後,點擊參考文獻中的“廣州上學網”,卻會進入色情網站。

在百度搜索部分小学和幼儿园,会被导向色情网站

我測試了一下,的確如此。

在百度搜索部分小学和幼儿园,会被导向色情网站

通過搜索,我發現至少有這些學校的百度百科參考資料會指向色情網站:廣州開發區第二小學、廣州市海珠區星雲幼兒園、廣州市越秀區大沙頭中英文幼兒園、沙河小學、北山小學、化龍中心小學、濱江東路第二小學、左邊小學、復甦小學、五鳳小學、芳華小學、協和小學、廣州市海珠區江南西藝星幼兒園、廣州市越秀區黃金實驗幼兒園、小洲小學、僑樂小學、金影小學、培紅小學、天河區龍洞小學、同福西路小學、聚德西路小學、博雅小學、天河區棠下小學、長安東街小學、增滘小學、禾豐小學、長湴小學、天河區駿景米洛英文幼兒園、瑞寶花園小學、黃村小學、廣雅實驗學校、橫沙小學、花都區新華鎮九潭小學、從化市從化英才幼兒園、樂賢坊小學、黃埔同仁小學、握山小學、三善小學。

為什麼會出現這種荒唐的情況?

根據我的分析,原因是:“廣州上學網”此前是一個真實的學校信息彙集網站,這些學校的百度百科頁面在編寫的時候,確實是指向了真正的“廣州上學網”。

後來,這個網站關閉了,內容無法再訪問。

再後來,“廣州上學網”的域名被色情網站運營者買下,設置成了自動跳轉色情網站。這樣一來,所有原本指向“廣州上學網”的鏈接,現在都會被跳轉到色情網站。

所以,百度是躺槍了?都怪色情網站太狡猾,百度對此並無責任?

並非如此。百度百科自稱“全球最大的中文百科全書”,是億萬中國人認知世界的渠道,並且在百度搜索結果中獲得了極高的展現權重,這就要求它必須採取措施,保證內容質量。

雖然百度百科是人人都可以編輯的,但平臺應該對最終呈現的內容負責。實際上,百度自身也對外強調:“參考資料要權威”,要杜絕色情、違法、廣告、虛假、灌水、惡意編輯等現象。

在百度搜索部分小学和幼儿园,会被导向色情网站

杜絕色情違法內容,不僅是編寫詞條的時候要審核,在詞條通過之後也應該時常檢查:鏈接是否失效或被跳轉到其他網站。

以百度高超的技術能力(前不久剛剛平穩應對了春晚紅包的巨大流量),寫一個程序檢查百度百科中的失效鏈接和可疑跳轉,是一件再簡單不過的事情。

然而遺憾的是,百度並沒有做這件事情,而是讓色情網站的運營者鑽了空子,讓部分查詢小學和幼兒園信息的家長(乃至學生)被導向了色情網站。

過期鏈接問題是互聯網面臨的一大挑戰,我們可以對比一下維基百科是怎麼做的。

為了處理過期鏈接問題,維基百科特別制定瞭如何處理過期鏈接的詳細規則。

在百度搜索部分小学和幼儿园,会被导向色情网站

過去幾年中,在互聯網檔案館(Internet Archive)的幫助下,維基百科還利用機器人自動檢測失效鏈接,並替換為有效的歷史存檔鏈接,搶救了多達900萬個失效鏈接。

在百度搜索部分小学和幼儿园,会被导向色情网站

這裡就不得不提一嘴互聯網檔案館這個高能的資料庫。它最有名的“館藏”,就是互聯網時光機(Wayback Mahince),通過它,你可以看到很多網站過去的樣子,也可以找回現在已經不存在的網站之前的模樣。

比如,我在互聯網時光機中輸入“廣州上學網”的網址,就能看到:從2011年下半年開始,就有了這個網站。

在百度搜索部分小学和幼儿园,会被导向色情网站

點進2013年的一個快照,可以看到當時這個網站長這樣:

在百度搜索部分小学和幼儿园,会被导向色情网站

從2015年開始的快照,就顯示這個網站不再正常運轉。2018年的快照,抓下來的就是色情網站。

互聯網時光機這個神奇工具的社會意義,怎麼說都不為過。它保留下了珍貴的檔案資料,供我們探索和研究。

正是在時光機的幫助下,維基百科上的幾百萬失效鏈接,都被重新指向了正確的歷史版本。

為了防止今後再出現鏈接過期現象,現在,每當用戶在維基百科上添加了一個外部的引用鏈接,互聯網時光機就自動會把這個頁面爬取下來儲存到自己的服務器上,以保證之後一定可以追溯得到。

互聯網檔案館的“館藏”還不止於此,它還收錄了巨量的圖書、音頻、影像、軟件、遊戲等資料,還開設了專門的“川普數據庫”等主題館藏,收集了和川普有關的電視新聞、演講、辯論等。如果你喜歡翻閱資料,你一定會在其中找到自己感興趣的內容,很可能陷入其中無法自拔。

在百度搜索部分小学和幼儿园,会被导向色情网站

維基百科和互聯網檔案館,都能夠讓你感受到互聯網最美好的樣子:豐富、優質的信息,悉心的編輯整理,無償開放的使用,藉助技術解決最緊要的問題。

最最重要的是:對信息負責任的態度。

重金投入人工智能的百度,不妨分出一點點資源解決失效鏈接問題,以免小學生誤入色情網站?

最後想說,我和百度並無私人恩怨,我只希望通過對問題的揭示,以及對國外解決問題的方法的介紹,來告訴大家:我們的互聯網信息環境很不理想,我們的互聯網平臺本來是可以做得更好的,它們也應該做得更好,而這需要我們每一位用戶向它們施加更大的壓力,大聲說出自己的不滿,告訴它們用戶真正的需求是什麼,更加在意地挑選手機中安裝的app。

我會繼續觀察和監督,希望你也是。

在百度搜索部分小学和幼儿园,会被导向色情网站

維基百科和互聯網檔案館,都能夠讓你感受到互聯網最美好的樣子:豐富、優質的信息,悉心的編輯整理,無償開放的使用,藉助技術解決最緊要的問題。最最重要的是:對信息負責任的態度。


分享到:


相關文章: