起底谷歌干預搜索算法、修改搜索結果內幕

每一分鐘,谷歌(Google)就會收到380萬條搜索請求,其算法將給出各種各樣的答案,從酒店評級到乳腺癌療法,或者關於美國總統特朗普(Trump)的最新消息。

可以說,他們是全球經濟中最強大的程序代碼,控制著從互聯網獲取信息的閥門,也是數以十億計美元商業活動的起點。

20年前,谷歌的幾位創始人開始打造這個巨無霸,其出發點是認為用算法可以比人工更有效地對網絡上的有用信息進行梳理。在很多場合下——無論是在與外部團體的非公開會面中,還是在美國國會作證時,谷歌的幾位高管反覆重申,算法是客觀的,其本質上獨立自主,不會受到人類偏見或者商業利益“玷汙”。

起底谷歌干預搜索算法、修改搜索結果內幕

谷歌在一篇博客中寫道:“我們不會通過人工方式對頁面上的搜索結果進行收集或安排。”谷歌表示不能透露算法運行的細節情況,因為長期以來一直有人企圖鑽系統漏洞來從中牟利,這其中涉及到巨大的利益。

然而,這一信息常常與幕後的真實運作相矛盾。《華爾街日報》(Wall Street Journal)在調查中發現,谷歌在越來越多地對搜索結果進行工程改造和干預,其程度之深遠遠超過該公司及其高管所承認的水平。

很多時候谷歌這樣做是因為受到了來自企業、外部互聯網組織和世界各國政府的壓力。《華爾街日報》發現,自從2016年美國大選以及網絡上的誤導信息大行其道以來,這些干預行為急劇增加。

這些運作手法的演進,標誌著谷歌的基本理念已經從“組織全世界的信息”變成了更加主動地決定應該如何展示信息。

《華爾街日報》通過上百次採訪以及自行對谷歌搜索結果進行測試後有以下發現:

‧谷歌對算法的修改讓大公司在搜索結果上比小公司獲得更多關照。至少有一次,谷歌替主要廣告主eBay修改了算法,這與其絕不會出現此類行為的公開立場相違背。據知情人士透露,該公司還提升了亞馬遜(Amazon.com)和Facebook等大網站的排名。

‧谷歌工程師會經常性地在後臺對搜索結果之外的其他信息進行調整,而且這些信息越來越多地被置於基礎搜索結果之上。這些特別功能包括自動提示、“知識面板”和“精選摘要”等板塊,以及相關的新聞,這些都不符合該公司限制工程師刪除或修改信息的政策。

‧儘管谷歌矢口否認,但該公司確實在維護多份黑名單,用來屏蔽掉某些網站或者阻止出現某些類型的搜索結果。這份黑名單屏蔽的對象,既不屬於美國政府或者外國法律要求屏蔽的網站——比如有虐童或者盜版內容的網站,也不是為了抑制垃圾信息網站,這類網站為了取得更高的搜索排名會不斷地鑽系統漏洞。

‧在谷歌的自動補全功能方面——也就是根據用戶在搜索框敲入的字符預測性地提供搜索關鍵詞——其工程師構建的算法和黑名單會屏蔽掉與諸如“墮胎”或者“移民”之類爭議性話題有關的煽動性提示,從而實質上過濾掉了敏感話題的煽動性搜索結果。

‧包括谷歌聯合創始人拉里‧佩奇(Larry Page)和謝爾蓋‧布林(Sergey Brin)在內,谷歌的員工和高管對於干預搜索結果的尺度持有不同的看法。谷歌的員工可以爭取對特定的搜索結果進行修改,比如與疫苗和自閉症等話題有關的結果。

‧谷歌為了評估其搜索結果,僱傭了數以千計的低薪合同工。據該公司稱,這些人的工作是評估算法的搜索結果排名質量。即便如此,根據《華爾街日報》對幾位合同工的採訪,谷歌會在反饋中向他們灌輸其認為正確的排名結果,然後這些合同工會對自己的評估做出相應修改,最後他們的集體評估會被用來調整算法。

在此之前,有很多國家的監管部門都對谷歌手握如此巨大的權力表示過擔憂,其中包括反壟斷、政治傾向和網絡誤導信息等方面。對此,谷歌的核心辯護之一是它不會對展示給用戶的搜索結果進行編輯控制。而《華爾街日報》的上述發現對谷歌的這一辯護構成不利。

谷歌的算法,遠不是無視外界壓力的自主電腦程序,而是服從於高管和工程師的經常性修改,工程師修改它固然是為了交付更具相關性的搜索結果,但同時也是為了取悅各路強大的利益集團,併為谷歌母公司超過300億美元的年利潤添磚加瓦。谷歌是當今世界訪問量最高的網站,在搜索引擎市場的佔有率超過90%。其母公司Alphabet Inc.的市值超過9,000億美元。根據來自谷歌和一位知情人士的數據,谷歌在2018年對算法進行了超過3,200次修改,相比之下2017年是2,400次,2010年則只有500次左右。谷歌為此解釋說,目前多達15%的搜索請求含有過去從未見過的詞彙或詞組,因此需要工程師對算法進行更多修改,以確保交付有效的搜索結果。

對於《華爾街日報》的結論,谷歌的一位發言人辯解說:“我們現在做的事情與過去一樣,就是根據最可靠的信息來源提供相關的結果。”

這名叫拉臘‧萊文(Lara Levin)的發言人表示,公司的評估員指導原則以及算法設計都是透明的。


分享到:


相關文章: