11.24 华尔街日报:深度起底谷歌干预搜索、修改搜索结果的内幕

前言

本篇正文是《华尔街日报》历时半年多撰写的关于Google操作搜索结果的调查报告。Google作为一家公司,政治倾向是非常明显的。比如你搜American Scientist

这是修正过的版本,

以前的版本排第一的是个非洲裔美国人,

现在改成排第二了。

如果你搜一些可能让民主党不爽的关键词,Google会适时在你的结果里插入一些所谓的factcheck 网站。比如你搜 hunter biden guilty, fact check的结果排序在纽约时报之上。

再比如Youtube上有个著名频道PragerU ,因为偏保守的立场,经常被YouTube删视频。PragerU一怒之下把Youtube告上了法庭,起诉Youtube内容审查。这个事情引起了法学界的关注,比如哈佛法学院发了一篇关于宪法第一修正案是否适用于互联网的讨论。

https://jolt.law.harvard.edu/digest/prageru-v-youtube-does-the-first-amendment-apply-to-the-internets-public-square

华尔街日报花了半年时间,深入调查了Google的搜索结果算法,发出了这篇长文。我们全文转发。

正文

每一分钟,谷歌(Google)就会收到380万条搜索请求,其算法将给出各种各样的答案,从酒店评级到乳腺癌疗法,或者关于美国总统特朗普(Trump)的最新消息。

可以说,他们是全球经济中最强大的程序代码,控制着从互联网获取信息的阀门,也是数以十亿计美元商业活动的起点。

20年前,谷歌的几位创始人开始打造这个巨无霸,其出发点是认为用算法可以比人工更有效地对网络上的有用信息进行梳理。在很多场合下——无论是在与外部团体的非公开会面中,还是在美国国会作证时,谷歌的几位高管反复重申,算法是客观的,其本质上独立自主,不会受到人类偏见或者商业利益“玷污”。

谷歌在一篇博客中写道:“我们不会通过人工方式对页面上的搜索结果进行收集或安排。”谷歌表示不能透露算法运行的细节情况,因为长期以来一直有人企图钻系统漏洞来从中牟利,这其中涉及到巨大的利益。

然而,这一信息常常与幕后的真实运作相矛盾。《华尔街日报》(Wall Street Journal)在调查中发现,谷歌在越来越多地对搜索结果进行工程改造和干预,其程度之深远远超过该公司及其高管所承认的水平。

很多时候谷歌这样做是因为受到了来自企业、外部互联网组织和世界各国政府的压力。《华尔街日报》发现,自从2016年美国大选以及网络上的误导信息大行其道以来,这些干预行为急剧增加。

这些运作手法的演进,标志着谷歌的基本理念已经从“组织全世界的信息”变成了更加主动地决定应该如何展示信息。

《华尔街日报》通过上百次采访以及自行对谷歌搜索结果进行测试后有以下发现:

谷歌对算法的修改让大公司在搜索结果上比小公司获得更多关照。至少有一次,谷歌替主要广告主eBay修改了算法,这与其绝不会出现此类行为的公开立场相违背。据知情人士透露,该公司还提升了亚马逊(Amazon.com)和Facebook等大网站的排名。

谷歌工程师会经常性地在后台对搜索结果之外的其他信息进行调整,而且这些信息越来越多地被置于基础搜索结果之上。这些特别功能包括自动提示、 “知识面板”和“精选摘要”等板块,以及相关的新闻,这些都不符合该公司限制工程师删除或修改信息的政策。

尽管谷歌矢口否认,但该公司确实在维护多份黑名单,用来屏蔽掉某些网站或者阻止出现某些类型的搜索结果。这份黑名单屏蔽的对象,既不属于美国政府或者外国法律要求屏蔽的网站——比如有虐童或者盗版内容的网站,也不是为了抑制垃圾信息网站,这类网站为了取得更高的搜索排名会不断地钻系统漏洞。

在谷歌的自动补全功能方面——也就是根据用户在搜索框敲入的字符预测性地提供搜索关键词——其工程师构建的算法和黑名单会屏蔽掉与诸如“堕胎”或者“移民”之类争议性话题有关的煽动性提示,从而实质上过滤掉了敏感话题的煽动性搜索结果。

包括谷歌联合创始人拉里‧佩奇(Larry Page)和谢尔盖‧布林(Sergey Brin)在内,谷歌的员工和高管对于干预搜索结果的尺度持有不同的看法。谷歌的员工可以争取对特定的搜索结果进行修改,比如与疫苗和自闭症等话题有关的结果。

谷歌为了评估其搜索结果,雇佣了数以千计的低薪合同工。据该公司称,这些人的工作是评估算法的搜索结果排名质量。即便如此,根据《华尔街日报》对几位合同工的采访,谷歌会在反馈中向他们灌输其认为正确的排名结果,然后这些合同工会对自己的评估做出相应修改,最后他们的集体评估会被用来调整算法。

在此之前,有很多国家的监管部门都对谷歌手握如此巨大的权力表示过担忧,其中包括反垄断、政治倾向和网络误导信息等方面。对此,谷歌的核心辩护之一是它不会对展示给用户的搜索结果进行编辑控制。

而《华尔街日报》的上述发现对谷歌的这一辩护构成不利。

谷歌的算法,远不是无视外界压力的自主电脑程序,而是服从于高管和工程师的经常性修改,工程师修改它固然是为了交付更具相关性的搜索结果,但同时也是为了取悦各路强大的利益集团,并为谷歌母公司超过300亿美元的年利润添砖加瓦。谷歌是当今世界访问量最高的网站,在搜索引擎市场的占有率超过90%。其母公司Alphabet Inc.的市值超过9,000亿美元。根据来自谷歌和一位知情人士的数据,谷歌在2018年对算法进行了超过3,200次修改,相比之下2017年是2,400次,2010年则只有500次左右。谷歌为此解释说,目前多达15%的搜索请求含有过去从未见过的词汇或词组,因此需要工程师对算法进行更多修改,以确保交付有效的搜索结果。

对于《华尔街日报》的结论,谷歌的一位发言人辩解说:“我们现在做的事情与过去一样,就是根据最可靠的信息来源提供相关的结果。”

这名叫拉腊‧莱文(Lara Levin)的发言人表示,公司的评估员指导原则以及算法设计都是透明的。

作为这次调查的一部分,《华尔街日报》在今年夏天对谷歌的搜索结果进行了为期数周的测试,并将这些结果与另外两家搜索引擎竞争对手——微软的Bing和DuckDuckGo——的搜索结果进行比对。

DuckDuckGo是一家专注于保护用户隐私的公司,其搜索结果综合其他多家公司提供的信息,其中包括Verizon Communications Inc.旗下的雅虎(Yahoo)搜索引擎。测试显示,谷歌处理自动补全查询的方式以及一些该公司所谓的自然搜索结果(算法根据用户查询问题的相关性得出的搜索结果)与另外两家竞争对手存在广泛的差异。谷歌发言人莱文拒绝就《华尔街日报》在测试中得到的一些具体搜索结果予以置评。她笼统地表示,“我们的系统是以根据权威信息源得出相关性结果为宗旨。”她还说,自然搜索结果“不能完全代表通过搜索可获取的信息。”

《华尔街日报》测试了自动补全查询功能,谷歌声称该功能是调用其庞大的数据库,并结合用户的定位和搜索历史等数据,来预测用户会输入什么文字。测试显示出谷歌相对于其他搜索引擎会在多大程度上屏蔽某些提示。

输入“乔‧拜登(Joe Biden)是”或者“唐纳德‧特朗普(Donald Trump)是”,谷歌自动补全功能预测的文字相比其他搜索引擎更加温和中立。《华尔街日报》也测试了其他美国总统竞选人的名字,也显示出相似的差异。

《华尔街日报》还用自动补全测试了几个搜索关键词,比如“移民是”和“堕胎是”。相对于其他搜索引擎,谷歌提供的备选项煽动性更低。

DuckDuckGo的首席执行长(CEO)加布里埃尔‧温伯格(Gabriel Weinberg)表示,对于某些搜索关键词或者短语,比如攻击性可能比较强的文字,DuckDuckG会屏蔽掉所有的自动补全提示,这些提示信息是由雅虎授权提供的。她表示,像“唐纳德‧特朗普”和“乔‧拜登”之类《华尔街日报》在测试中用到的关键词不会遭到此类屏蔽。

一位来自雅虎运营商Verizon Media的发言人称:“我们致力于为用户和合作伙伴提供安全和可信赖的搜索体验。我们也努力地确保在雅虎搜索内提供的搜索提示能反映这一宗旨。”

微软的一位发言人称:“我们致力于确保我们的搜索结果尽可能的相关、适度并且可信赖。整体而言,我们的规则是尽可能不干预算法的常规运行。”

从《华尔街日报》分析的其他一些方面则可以看出,一些敏感词以及政治家姓名的谷歌自然搜索结果和搜索到的新闻,能够鲜明地体现保守派和自由派双方新闻渠道。

如果用一个比喻来形容的话,算法就像是编程用的菜谱,它一步步地指导计算机如何解决具体的问题。不光是互联网,智能手机和平板电脑上塞满的应用(app)也是靠它们在背后驱动。

算法决定了哪些朋友会在Facebook用户的消息流里冒泡,它决定了Twitter上的哪条推文最有可能得到病毒式传播,它还决定了高峰时段又或是午夜时分叫一辆Uber出租的费用。银行用它来筛选贷款申请,公司企业用它筛选求职申请,保险公司用它来决定某个投保人的预期寿命。

刚开始的时候,算法拥有的权力很少受到质疑。尤其是对于谷歌,它那些富有创新性的算法以一种在当时具有突破性的方式对网站内容进行排名,而且蕴藏着巨大的盈利空间。该公司将“让网络变得更有用”作为自己的目标,而这一切的基本假设是靠代码本身就能完成对信息进行排名的沉重工作。

但坏分子越来越多地企图操纵搜索结果,还有公司试图钻系统的漏洞,误导信息在各大科技平台大行其道。谷歌发现自己面临着与Facebook类似的压力,后者一直声称自己只是以连接世人为宗旨,但是却不得不对自己平台上发布的内容进行管治。

谷歌在2016年展开过一项内部调查,据该公司一位负责搜索业务的高管透露,该调查显示,有0.1%-0.25%的搜索请求会多多少少地出现带有不实信息的结果。虽然从百分比看数字很小,但考虑到谷歌庞大的搜索量,这代表着每年近200亿条搜索。

相比之下,Facebook因为俄罗斯散布的不实信息被1.26亿用户阅读过而面临美国国会审查。

谷歌发言人莱文表示,上述数字不只包括不实信息,也包括被定义为“低质量”的多种其它内容。”她对《华尔街日报》推算的受影响的搜索结果数量提出了异议。谷歌不披露其搜索相关指标。

谷歌组建了一支精英小队来解决这个问题,这项行动在内部被称为“猫头鹰计划”。工程师借鉴了之前打击垃圾邮件所用的策略,他们会对页面内能够体现“权威性”的因子进行强调,实际上将没有体现这些特性的页面的搜索排名压低。

包括Facebook在内的其他科技平台已经采用一种更主动的方法,那就是手动删除存在问题的内容,并针对被定性为不实信息的内容制定管理规则。谷歌对此表示,自己的角色是提供内容的“索引”,而不像Facebook是内容的“载体”,这意味该公司不应该采取更主动的做法。

按照谷歌一位负责搜索业务的高管的形容,定义不实信息“异常困难”。他表示,该公司并不愿意在这件事上花很大力气。

据知情人士称,就在谷歌开始着手解决不实信息之类的问题时,更多的投诉开始出现,主要围绕那些人工干预变得更常见的领域,谷歌因此面临要对一些极其复杂的社会问题做出判定的局面。一些搜索结果的修改或许是合理的,比如提升全美预防自杀生命线(National Suicide Prevention Lifeline)之类值得信赖网站的排序,然而谷歌很少披露什么时候以及为什么要做这些修改。

在谷歌所主导的这个市场,企业、议员和广告客户都对公正和竞争存在担忧,结果就是谷歌的运营遭到外界严密审视。

今年早些时候,美国司法部启动了一项反垄断调查,谷歌的搜索政策和实践预计将成为其中焦点。过去一年来,谷歌高管已经两度被召唤到国会就政治倾向问题作证。在大西洋彼岸,谷歌过去三年因为一些反竞争性做法而被欧盟罚款逾90亿美元,这些指控中包括谷歌搜索引擎为自家产品提供额外关照。

作为回应,谷歌声称自己在一个瞬息万变的科技领域面临激烈的竞争,其目标是协助消费者创造选择,而不是伤害竞争对手。目前该公司正在对欧盟的罚款决定进行上诉,并且否认了存在政治倾向的指责。

谷歌很少公布调整算法的详细信息,而这些改动让企业和利益团体不安,他们感觉自己是在这家科技巨人的随意摆布下运营。

有一项算法改动在谷歌内部引发过激烈讨论。工程师选择让搜索结果向大公司倾斜,而不是较小的公司。这项调整背后的主张是,顾客更有可能在规模更大的渠道获得他们想要的东西。据知情人士称,一项算法调整提升了亚马逊公司(Amazon.com Inc., AMZN)商品的排名,哪怕是这些商品已经断货。

知情人士透露,这些年来,谷歌搜索业务高管们开会讨论算法调整时经常发生这类争论,但每一次他们都选择不推翻修改。

多位谷歌工程师表示,公司内部广泛认同一个观念,那就是搜索属于零和游戏:如果一项修改让一个搜索结果排名上升,那肯定会压低另一个结果的排名,而这往往会让牵涉到的公司受到显著影响。

谷歌发言人莱文称,在谷歌的评估指导方针里没有任何一条暗示大型网站天生比小网站更权威。她补充称:“说我们没有着手解决诸如断货商品在搜索结果中排名靠前等问题,这是不准确的”。

谷歌已从一家专注工程、学术文化浓厚的公司,变成了一头广告巨兽、一家全世界最赚钱的公司,而该公司进行的许多调整正好出现在上述变化过程中的关键时点。去年,包括搜索广告以及地图和YouTube等产品上广告的谷歌广告营收高达1,163亿美元。

知情人士透露,一些非常大型的广告客户得到过来自谷歌的直接建议,指导他们如何提升自己的自然搜索排名,而那些与谷歌没有联系的公司则享受不到此等福利。某些情况下,这些帮助包括委派搜索工程师解答问题。

Americas of Dentsu Inc.旗下iProspect的首席执行长Jeremy Cornfeldt表示:“如果他们更新了算法,我们的团队可能会跟他们通电话,他们会解答我们的问题。”Cornfeldt称,他们是谷歌最大的广告代理客户之一,背后的广告主包括列维公司(Levi Strauss & Co., LEVI)、爱尔康医药有限公司(Alcon Inc, ACL)和Wolverine World Wide (WWW)。但他表示,他们并不能获得谷歌不公开分享的信息。

一位曾经从谷歌接到过这类指导的前世界500强企业高管透露,谷歌经常调整抓取网页和对页面进行排名的方式,来解决某些大型网站的排序问题。

知情人士称,谷歌会较频繁地升级Facebook和亚马逊等一些网站的索引,这会帮助他们更频繁地出现在搜索结果中。

上述前世界500强企业高管表示:“有人以为搜索算法是完全中立的,以为它们只是对网络信息进行梳理然后将结果显示出来,这完全是胡说八道。”他称,谷歌一直对一些具体问题具体处理。

谷歌发言人莱文表示,谷歌搜索团队不为网站拥有者提供专门指导。她还称,为网站更快地建立索引并不意味着能获得更高的排名。她表示:“我们优先考虑的是影响力,而不是任何商业关系。”

THE WALL STREET JOURNAL

电商网站eBay很早就依靠谷歌导流,该网站多达三分之一的互联网流量来自谷歌。2014年,eBay的流量突然锐减,导致其当年的营收预期减少2亿美元。

谷歌当时告知eBay,决定下调大量eBay页面的搜索排名,而这些页面是eBay网络流量的一大来源。

知情人士透露, eBay高管当时讨论过要不要撤回对谷歌的大约3,000万美元季度广告支出,以示抗议。但最后决定只是加大游说力度,安排员工和高管与谷歌的搜索工程师通电话或者会面。在此之前的更早几年,eBay也碰到过一次类似搜索调整导致流量滑坡的情况。一位知情者称,eBay也是运用自己的游说能力,说服谷歌提供指导来修复问题,甚至依靠一位曾在谷歌任职的员工动用人脉来解决此事。

知情人士称,2014年那次事件中,谷歌最终同意提升一大批被向后靠的eBay页面的搜索排名,而eBay则对网站进行了一次广泛的改版,以使页面变得更加“有用和相关”。其中一位知情者称,这次改版耗用了大量人力物力。该知情人士还透露,之后eBay还受到过排名降低的打击,而谷歌没有提供帮助。

eBay一名发言人表示:“多年来,谷歌的搜索引擎优化(SEO)让我们经历了一些重大且持续的排名降低,这给我们支持的那些小企业带来了不公平的伤害。”。SEO是指尝试为网站创造更多搜索引擎流量。

谷歌发言人莱文拒绝就eBay之事置评。

那些没有eBay那般强大势力的公司则有另一番经历。Dan Baxter忘不掉他的网站DealCatcher因为一次谷歌算法调整而遭殃的那一刻。这家位于特拉华州威尔明顿的折扣券网站是他在20年前创办,有12名员工。这次算法调整发生在今年2月17日周日的下午6点。第二天一早,Baxter接到一名员工的电话。

Baxter回忆说,该员工异常紧张地问:“你看了我们的流量数据吗?”当时,该网站流量莫名其妙地突然下滑了93%。两天前的周六,DealCatcher从谷歌获得的访客量是3.1万,而周一只剩下2,400。他的网站几乎从谷歌搜索中彻底消失。

Baxter表示,他不知道可以联系谷歌的谁,于是请来一位顾问帮助弄清楚到究竟发生了何事。这位专家直接联络了在谷歌的一个联系人,但没有得到答复。Baxter试着在一位谷歌“网络管理员”主持的YouTube论坛上发帖,询问这是否属于技术问题,但似乎被这位网络管理员否认了。

一个月后,DealCatcher的流量又莫名其妙地回来了,但他至今不知道个中缘由。

Baxter表示:“这有点像是走出黑暗的感觉,但这正是整件事情的可怕之处。”

谷歌发言人莱文拒绝就DealCatcher的遭遇置评。

(《华尔街日报》隶属于新闻集团(News Corp),后者曾公开抱怨过谷歌压制收费订阅新闻网站搜索排名的做法。经过新闻集团和其他收费出版商的密集游说,谷歌最后取消了这项政策。最近,新闻集团呼吁成立一个“算法审核委员会”来监督谷歌、Facebook及其他科技巨头。新闻集团签有通过Facebook提供新闻报道的商业协议,而《华尔街日报》的出版商道琼斯公司(Dow Jones & Co.)签有通过苹果公司(Apple Inc., AAPL)的服务提供新闻报道的商业协议。谷歌发言人莱文和新闻集团未予置评。)

谷歌最近几个月采取了新措施,通过更新该公司官网上的基本信息来向外界澄清其服务的运营方式。今年10月底,该公司发布了一条名为“谷歌搜索如何运行(How Google Search Works)”的新视频。

哈佛法学院(Harvard Law School)教授、伯克曼克莱因互联网与社会中心(Berkman Klein Center for Internet & Society)主任乔纳森‧齐特林(Jonathan Zittrain)表示,谷歌没有很好地定义干预搜索结果的频率和时间。特林称,谷歌有关不能披露细节是因为要对抗垃圾信息的说辞“显得愚蠢”。

“放在10年或者15年前,这种说法也许站得住脚,”他说道,“这被称为‘通过隐匿实现安全(security through obscurity)’。这是曾经在工程师中流行的一种理念,认为可以通过限制有关系统如何运行的信息来增强系统的安全性,但这一理念现在已经过时了。

谷歌发言人莱文说:“历史证明,极端的透明度会使坏人获得伤害遵守规则的用户和网站拥有者的能力。”

伯克曼克莱因研究中心的助理研究员约翰‧鲍尔斯(John Bowers)说:“建立这样一种服务意味着要做出成千上万十分复杂的人类决策,这不像人们想象中的那样。”

在这项工作的一端,谷歌的这些决策是由全世界最优秀、薪酬最高的工程师做出的,他们的工作是对数百万行复杂的代码进行控制;而在另一端,则是负责评估搜索结果的上万合同工大军,他们在家工作,按小时拿报酬。

知情人士称,这些合同工提供的搜索排名可以间接地调高或者调低某个搜索结果的排名;他们根据一份长达数百页的指导手册开展工作,他们的集体反应由谷歌的高管进行评估,并被用于影响搜索算法。

THE WALL STREET JOURNAL

一家新奥尔良旅游公司的27岁物流经理扎克‧兰利(Zack Langley)就曾做过谷歌的评估员。他在2016年春天通过莱博智科技公司(Lionbridge Technologies Inc.)获得一份评估谷歌搜索结果的一年期合同。莱博智科技是谷歌和其他科技平台用来完成合同工作的数家公司之一。

兰利称,在他作为评估员的工作期间,从来没有与谷歌的任何人有过任何联系,也没有被告知他的工作成果将作何用途。与所有的谷歌评估员一样,他也签署了一份保密协议。他每周在家里工作至多20小时,每小时薪酬为13.5美元。

有时候穿着睡衣工作的他会收到数百条真实的搜索结果,然后被告知根据质量、信誉、有用程度以及其他一些因素来给出评价。

有一次,关于“最佳自杀方式”的搜索结果让兰利感到不快,这些搜索结果的链接内容就好像是一本“自杀指南”。他说,他对其他所有链接都给出了较低的评价,直到全美预防自杀生命线(National Suicide Prevention Lifeline)排到第一位。

兰利说,谷歌很快通过莱博智发来一条通知,称应该把该热线在所有跟自杀相关的搜索结果中置顶,如此一来就能通过评估员的集体评价推动算法做出相应调整。他说,从来不知道自己的操作会对算法修改有何影响。

兰利表示,谷歌似乎是希望由他修改搜索页的内容,这样一来,谷歌就可以在做出算法修改决定时获得所谓的“合理免责借口”。他说,合同工们会收到来自莱博智的通知,告知他们其他搜索的“正确”结果,而兰利相信这是在谷歌授意下进行的。

兰利称,在2016年底美国总统大选接近尾声时,谷歌方面变得愈加活跃地指示最佳搜索结果,不过涉及到的话题未必都跟大选有关。“

他们过去一直是一种不干预态度,但那时候似乎改变了,”兰利说。

谷歌发言人莱文表示,公司“很早以前就形成了针对这类查询的集体反馈机制,这帮助我们开发出多种算法解决方案和特别功能,”她还说道,“我们会对评估员的手册进行更新,以确保所有评估都遵守同一套总体框架。”

莱博智没有回应记者的置评请求。

在谷歌,其员工平时是使用一套公司内部留言板系统以及所谓的“go/bad”(好/坏)机制来推动具体的搜索结果修改。(这是一套汇报系统,谷歌员工可以用它指出有问题的搜索结果。)

知情人士透露,第一个敏感话题是在2015年出现。当时有员工投诉称,搜索“疫苗如何导致自闭症”会从反对疫苗的网站得到误导信息。

知情人士称,至少有一名谷歌员工为这个搜索结果进行辩护。此人写道,应该“让算法决定”该显示什么。然而,据该人士透露,谷歌修改了算法,让一个名为howdovaccinescauseautism.com的网站显示在首位。这个网站在其首页用硕大的加粗字体写着“They f—ing don’t.” (它们不会)。(这句话在谷歌内部成了一个很流行的梗。)

谷歌发言人莱文拒绝对此置评。

2018年秋季,美国保守派新闻网站布莱巴特新闻网(Breitbart News Network)发布了一条外流的谷歌高管视频,其中包括谢尔盖‧布林和谷歌CEO桑达尔‧皮查伊(Sundar Pichai),他们在两年前特朗普当选总统后表达了沮丧,并对员工做了相关演讲。谷歌的一些员工发现,在谷歌上搜索“谷歌外流视频特朗普”时,要翻到第12页才能找到这条视频,看上去是谷歌有意将该视频深藏。知情人士称,这些员工在公司的内部留言系统中投诉了该情况。很快,这条视频开始显示在更高位置。

“当我们接到报告说我们的产品没能按照预期运行时,我们会进行调查,看看能否找到有用的洞见来指引未来的改进。”莱文说道。

<figcaption>从谷歌成立之日起,佩奇和布林就知道网页排名跟人的观点意见是捆绑在一起的。1998年,他们在介绍自己的PageRank算法的论文中这样写道:“网页的重要性在于其内在的主观性,而这取决于读者的兴趣、知识和态度。” PageRank算法正是他们创办这家搜索引擎公司的基础系统。/<figcaption>

他们还写道,PageRank算法将评测读者的兴趣和态度水平,但是会以“客观而机械性”的方式来做这件事。他们主张,该系统会以其他相关网站链接到目标网站的次数来对某个网站的相关性进行量化评测。

如今,PageRank已经得到升级,并且被嵌入谷歌眼下在使用的超过200种不同算法中,适用于数以百计的信号。(PageRank在2005年被更新版本代替,可以更好地适应该网站的庞大流量。知情人士称,该版本的内部代号为“PageRankNG”,NG代表了“新世代”。在公开场合,该公司在解释搜索引擎工作机制时仍然沿用PageRank的叫法,其官网上的链接是指向佩奇和布林发表的原初算法。“那些关于利用链接模式的原初洞见和概念,至今仍然运用在我们的系统中,”莱文说道。)

在进入2000年代的头几年,垃圾信息网站一度让谷歌的算法败下阵来,它们运用多种策略误导搜索结果,让自己的网站获得更高排位。在如何应对这一问题上,佩奇和布林出现了分歧。

布林反对进行人工干预,他主张谷歌应该提供最忠实于算法的精确搜索结果,只有在最极端的情况下才应该修改算法。知情人士称,佩奇的意见与布林相左,他认为用户体验正因为搜索到垃圾信息网站而不是有效结果而遭到破坏。

在此之前,谷歌早就在采取所谓的“手动操作”来对付个别滥用算法的网站。谷歌工程师会通过修改网站的“权重”来压低其排名。比如,如果有一个网站向其他网站付费来与自己建立连接,从而人为地提升自己的排名,这是谷歌不认可的,工程师就会调低这个网站的权重。该公司也可以把一个网站加入黑名单,或者彻底删除其链接。

但布林仍然反对采取大规模措施来打击垃圾信息,因为这涉及到更多的人为干预。虽然布林是苏联犹太移民家庭出身,但是据知情者称,他甚至亲自决定允许反犹主义网站出现在查询 “犹太人”的搜索结果中。谷歌对这条搜索结果发布了一份免责声明称:“我们的搜索结果是在完全客观的条件下生成的,不为谷歌工作人员的信仰和选择所影响。”

终于,2004年的某一天,在谷歌加州山景城总部的一间洗手间里,佩奇主动跟该公司早期的搜索业务高管本‧戈梅斯(Ben Gomes)搭话,表示支持他打击垃圾信息的措施。据了解这段谈话的人士称,佩奇对戈梅斯说“做你需要做的事情就好”,他还说“谢尔盖将要毁掉这家公司。”

谷歌发言人莱文表示,佩奇、布林和戈梅斯都拒绝置评。

据知情者说,此后该公司修改了算法,来打击垃圾信息网站,并放松了对手动干预的规定。

谷歌对于修改搜索排名算法有一套指导规则,名为“启动委员会”,其流程费时费力。谷歌高管在国会作证时曾被问到修改算法方面的问题,他们介绍了这套流程的概况。知情者表示,这套流程有点像是为某个论点做辩护,在会议上的争论会变得很激烈。

其中一名知情人士透露,考虑到完成这套流程费时费力,一些工程师的态度是能避则避,而且有时候微小的修改可以不经过该委员会批准就通过。戈梅斯是这个委员会的“话事人”,他来决定是否批准修改,其他高管有时也会参会。

谷歌发言人莱文表示,并不是所有的算法修改都经过会议讨论,但是“组织的不同层级有其他评审流程来实现更快捷的改动”,比如通过邮件方式进行评审。她还表示,启动委员会的成员仍然会参与这些评审。

目前谷歌只披露了其算法会考量的几个因素,其中之一是“新鲜度”,它优先搜索最近创建的与突发新闻或体育赛事等相关的内容。另一个因素是用户所在位置,如果用户搜索“动物园”,谷歌工程师希望算法能提供用户所在地区内最好的动物园。还有就是语言信号——当不同的词汇组合在一起时,其含义会发生什么变化,比如“4月”与“傻瓜”——这是最重要的考量因素之一,这将帮助理解用户真正的查询目标。

据谷歌前员工透露,其他重要信号包括用户在点击返回谷歌之前会停留在他们所点击的页面上的时间长度。停留时间长有助于提升网页排名。快速地跳回意味着这个网页相关性弱,这会极大地伤害其排名。

谷歌多年来积累的这些用户行为数据已成为其一大竞争优势,极大地巩固了该公司在搜索市场的领头羊地位。其他搜索引擎获取不到像谷歌那么庞大的数据。

这使得谷歌的运营决策能产生巨大的影响。

今年早些时候,美国图片社交媒体平台Pinterest Inc. (PINS)提交上市申请时,该公司在申请文件中称:“诸如谷歌之类的搜索引擎,他们对自身算法和政策的修改,或者调整执行这些政策的方式,有可能会导致Pinterest的利益受损。”Pinterest还表示:“我们对这些行为进行申诉的能力有限。” Pinterest的一位发言人未予置评。

搜索引擎优化顾问变成了一份欣欣向荣的职业,他们帮助大大小小的公司破解谷歌算法。但即便是这些专家也表示,至今仍不太能够摸清这些算法的门道。“它就像是黑魔法,”格伦‧加布(Glenn Gabe)说道。加布是一位专研谷歌算法多年的SEO专家,今年早些时候,他曾试图帮助DealCatcher找到解决流量滑坡问题的办法。

包括广告在内,如今谷歌自己的特别功能已经在搜索结果首页占据着大量版面,而且几乎没有为用户提供显眼的区分提示。这其中包括位于页面顶部的新闻标题和视频,侧面的信息面板,以及强调相关问题的“人们也会问”(People also ask)提示框。

知情人士表示,谷歌工程师将这些功能视为独立于谷歌搜索的产品,而且并不是那么抗拒根据外部诉求来手动修改内容。

这些特别功能对于谷歌而言变得越来越重要。因为谷歌想要让用户停留在投放广告的搜索结果页,而不是跳转到其他网站。根据市场研究公司Jumpshot的数据,今年9月份,谷歌的手机搜索中有55%属于“无跳转点击”搜索,这种情况意味着用户没有离开搜索结果页。

《华尔街日报》发现,谷歌工程师的确会修改搜索结果页上两个典型的特别板块的显示结果。一个是知识面板,另一个是精选摘要。前者用来集中展示跟搜索结果相关的人物、事件和其他一些信息;后者以摘要方式推荐谷歌认为含有与用户搜索目标相关内容的结果。

THE WALL STREET JOURNAL

一位知情人士透露,今年4月,属于保守派的美国传统基金会(Heritage Foundation)致电谷歌,投诉谷歌知识面板将即将上映的电影《计划外》(Unplanned)贴上“政治宣传”的标签。该影片讲述美国计划生育联合会(Planned Parenthood)的一位前总监改变自己的想法,最后变成反堕胎支持者的故事。

该知情人士称,在传统基金会向谷歌的一位联系人投诉此事后,该公司表达了歉意,并删除了影片描述中的“政治宣传”字样。

谷歌发言人莱文表示,这些修改“并不是因为外部团体施加的压力,而是违反了该板块的公司政策”。

说到谷歌的自动补全功能,2012年,谷歌与法国政府达成了一份保密协议,起因是几家外部团体投诉该功能带有反犹倾向。当用户在搜索栏输入几位重要政治人士的名字时,自动补全会给出法语的“犹太人”单词提示。知情人士透露,谷歌在协议中同意“在算法上缓解”这类自动提示,以此作为一项禁止双方公开其中条款的协议一部分。

近年来,谷歌对其自动补全算法做过多次修改,将“敏感的和贬低性的提示”删除。在该公司官网上可以找到详细的政策说明。该说明称,谷歌不允许预测性提示中出现“与骚扰、霸凌、威胁、不当性挑逗相关,或者暴露个人隐私和敏感信息”的内容

虽然谷歌在自动补全功能的适宜度问题上变得比过去更透明,但该公司至今没有披露其黑名单的使用情况。自动补全功能是由前谷歌工程师凯文‧吉布斯(Kevin Gibbs)在2004年创造,也是他最早编制了一份不予推荐的关键词名单,哪怕这些关键词来自算法在不受干预情况下会予以推荐的最热门的搜索提问。

例如,如果用户搜索“布兰妮‧斯皮尔斯”(Britney Spears)——当时谷歌最热的搜索之一——吉布斯并不希望有人输入她的名字时出现任何描述人体器官或者是性行为的提示。未经过滤的结果“非常恐怖”,吉布斯在接受采访时说道。

他表示,无论是决定该还是不该出现在这份名单上,都是件很困难的事情。“这件事情很不舒服,我感受到很大的压力,”吉布斯说。他在自动补全功能部门工作了大约一年,在2012年离开谷歌。他说,“我希望确保它能公正地代表世界,不将任何群体遗漏掉。”

知情人士透露,谷歌至今仍在维护一份关键词和词组黑名单,这些词会在自动补全功能中被手动屏蔽掉。

另据知情人士透露,谷歌内部对于可能需要在自动补全中被屏蔽的关键词和词组有“一套明确阐述的政策”,并且这份黑名单也符合对应的规则。

知情人士还称,无论是自然搜索结果、谷歌新闻,还是网络回答、知识面板等其他搜索产品,都会受到不同的黑名单影响。

谷歌方面在国会作证时已表示自己没有使用黑名单。2018年,主管谷歌公共政策的副总裁卡兰‧巴蒂亚(Karan Bhatia)在听证会上曾被问到谷歌是否“出于政治原因……将任何公司、组织、个人或者渠道”纳入黑名单时,他回答说:“不,女士,我们并不使用黑名单或者白名单来影响我们的搜索结果。”

谷歌发言人莱文称,这些证词是指针对政治团体的黑名单,而谷歌并没有这类黑名单。

谷歌最早的黑名单可以追溯到新千年初期。据知情人士称,该公司列出了一批从索引中删除的垃圾信息网站。这意味着这批网站再也不能出现在搜索结果中。

一批被称为“维护人员”的工程师获得授权,可以动手修改和批准黑名单。知情人士透露,这个过程至少需要两个人来完成,一个人负责修改,另一个人负责批准。

《华尔街日报》看到了一份草拟于2018年8月的谷歌政策草案,用来指导谷歌员工如何完成一份反误导信息黑名单,其目的是在谷歌新闻和其他搜索产品中屏蔽掉某些发布者。该文件称,工程师应该专注于“对自己的所有权和网络资产存在虚假描述”的发布者,以及存在“欺骗性内容”的发布者——是指那些以主动误导为目的网站,而不是所有存在不实内容的网站。

上述文件称,“这份黑名单的目的是阻止这类网站出现在任何搜索功能或者新闻产品网站上。”

谷歌发言人莱文称,谷歌“不会手动决定任何搜索结果的排序”。她表示,那些不符合谷歌新闻“收录政策”的网站,“没有资格出现在新闻板块或者搜索页的信息栏中”。

一些个人和公司称,谷歌的这些修改像是临时决定的,或者前后不一。知情者称,谷歌越来越多地想要进行手动干预或者修改算法,但为了维护自身不受外界压力影响的形象而又不愿公开承认。

一位前谷歌高管表示:“对我们来说,‘所有决定都是算法做出的’是一个非常好用的挡箭牌。

2017年3月,谷歌更新了提供给搜索结果评估合同工的指导手册,第一次建议他们对“完全是为了传播针对某个人群的仇恨和暴力而建立”的网站给予低质量评价,这会有助于调整谷歌算法,降低这些网站的排名。

2018年,该公司将这一政策的适用范围扩大到所有传播此类仇恨和暴力的网页,哪怕该页面不是完全以此为目的,也不论该页面是否采用“礼貌的甚至是学术性的语言进行表达”。

另一方面,对于遭到外部人士投诉,认为应该被屏蔽掉的一些内容,谷歌却并不乐意赶尽杀绝。2018年5月,一名叫帕拉西奥斯(Ignacio Wenley Palacios)的西班牙律师请求谷歌在搜索结果中删除一篇反犹太文章。帕拉西奥斯效力于一家名为法律战计划(Lawfare Project)的非盈利组织,该组织为保护犹太人的诉讼提供资助。此文章发表于一个西班牙语新纳粹博客上,为一位德国纳粹大屠杀的否认者歌功颂德。

谷歌拒绝了这一请求。谷歌律师在回覆帕拉西奥斯的邮件中辩解说,尽管这类内容令人厌恶,但它在西班牙并不是明确违法。

于是帕拉西奥斯提起了诉讼。但是据他说,今年春天,就在马上要开庭之前,谷歌的律师告诉他,公司正修改在西班牙的删除政策。

据帕拉西奥斯表示,谷歌律师告诉他,在西班牙进行的搜索中出现的任何否认大屠杀和可能伤害弱势少数群体的其他内容,谷歌一旦接到举报都会删除相关链接。这些结果在西班牙以外的地区仍然可以被搜到。他说,经过双方同意,该诉讼最终被撤销。

谷歌发言人莱文表示,这一行为属于为遵守所在地法律而进行的“合法删除”。在西班牙,虽然否认大屠杀本身并不违法,但如果带有传播仇恨的意图,则可认定违反西班牙刑法,该法禁止某些形式的仇恨言论。

“谷歌以前常说,‘我们并不认同这个内容,但它就是这样的’。” 帕拉西奥斯说道,“现在他们的态度变化很大。”

THE WALL STREET JOURNAL

<figcaption>健康政策顾问乔治‧威廉姆斯(Greg Williams)表示,他曾协助领导一项运动,推动谷歌进行修改,消除那些在“戒断康复”等搜索中出现的误导性结果。/<figcaption>

当时是2017年前后,一些有过劣迹的戒瘾中心经常出现在谷歌搜索结果中,而谷歌往往是瘾君子及其家庭成员寻求帮助的第一站。

狄安娜‧亨吉斯(Diane Hentges)是一位瘾君子的母亲。去年她拼命地在网上为自己22岁的儿子查找毒品戒断治疗中心,谷歌搜索为她提供了好几个客服中心的联系方式。

每一次她给搜索到的机构打电话,联系上的客服代表总会询问她的财务信息,但是这些客服代表似乎并不隶属于任何合法的公司。

“如果你在谷歌上查一个地方,它会把你直接带向一个客服中心,” 亨吉斯说道。她还表示,那些为染上毒瘾的孩子吃尽苦头的父母,“甘愿为孩子的健康做任何事情。我们什么事情都相信。”

经过威廉姆斯和其他人的密集游说,谷歌修改了跟这类查询有关的广告政策。然而,戒断康复行业的管理人员也注意到谷歌搜索结果出现的一个明显变化,对“戒断康复”或者相关关键词的许多搜索,结果页的首位开始变成药物滥用和精神卫生服务管理局(Substance Abuse and Mental Health Services Administration,简称:SAMHSA)的网址——一个由美国卫生及公共服务部运营的全国性求助热线。

SAMHSA的一位发言人表示,该机构与谷歌有合作关系。

谷歌从未承认这个修改。其发言人莱文称,“相关资源不会因为任何此类合作关系而被列入搜索结果”,“我们设计的算法解决方案会在此类查询中,以及在与自杀、自残相关的查询中,将权威资源(包括官方热线)放在优先位置。”

在好莱坞打击影视盗版的行动中,谷歌的搜索算法一直是个焦点。

<figcaption>影视公司“认为这可能成为自己生意的丧钟,”丹‧格里克曼(Dan Glickman)说道,他曾在2004年至2010年间担任美国电影协会(Motion Picture Association of America)的主席兼CEO。该协会一直是谷歌的公开批评者。“一部大制作电影,如果有人把它非法上传到网上,那么为了推广它而投入的上亿美元市场费就打了水漂。”/<figcaption>

根据谷歌发布的《透明度报告》(Transparency Report)以及《华尔街日报》的分析,谷歌去年收到了创纪录的160万宗因为版权问题而删除网页链接的请求。这些请求涉及超过7.4亿个网页,大约是2012年的12倍。

10年前,作为与好莱坞妥协的结果,谷歌在影视名称搜索的自动补全功能中删掉了“下载”一词,这至少这不会鼓励盗版内容的搜索。

2012年,谷歌投放了一个搜索结果过滤器,它会将依据美国版权法受到大量盗版投诉的网站排名降到更低位置。这事实上在普通的电影或音乐搜索中将许多盗版网站挤出搜索结果的首页,但如果用户专门输入盗版网站的名字,还是可以搜到。

知情者表示,最近几个月,在打击搜索结果中的盗版内容问题上,好莱坞获得了谷歌前所未有的合作。

“跟Facebook一样,谷歌也面临更大层面的压力,” 格里克曼说,“这些公司很可能在联邦层面受到监管,其程度是他们从未预料到的。”

知情人士透露,相比佩奇和布林这两位创始人,2015年开始担任谷歌CEO的皮查伊更愿意接纳外部团体对搜索结果的投诉。

谷歌发言人莱文表示,皮查伊“参与和倾听反馈的风格一直没变。他对反馈始终持非常开放的态度。”

自2016年美国总统大选以来,对谷歌搜索结果存在政治偏见的批评声变得愈发尖锐。

各路右翼和左翼利益团体将谷歌团团包围,质疑其搜索结果中显示的内容,还有为什么其算法给出的结果让某些信息位于其他信息之上。

知情者称,谷歌委派了一位在华盛顿的高管——麦克思‧帕帕斯(Max Pappas)来处理保守派团体的投诉。据《华尔街日报》采访的利益团体称,当保守派的观点意见没有得到公正的代表时,帕帕斯会跟谷歌工程师一起,安排对搜索进行修改。

“保守派在这些公司里需要人来对接,”保守派研究机构媒体研究中心(Media Research Center)高管丹‧盖诺(Dan Gainor)说。媒体研究中心就多个问题向谷歌发起投诉。

知情者称,谷歌还委派了至少另一位在华盛顿的高管——夏奈尔‧哈迪(Chanelle Hardy)——来对接外部的自由派团体。

谷歌发言人莱文称,这两个职务已经存在多年。她表示,从大层面看,公司认为理解这些团体的反馈是“责任之所在”。她还表示,谷歌的算法和政策无意根据网站的政治倾向来做出任何评判。

帕帕斯不予置评。哈迪没有回覆置评请求。

知情人士透露,过去一年来,女性堕胎权利组织曾多次投诉,称在谷歌上会搜索到所谓的“怀孕危机中心”的网站,这些组织会向女性提供反对堕胎的咨询建议。

发言人克里斯汀‧福特(Kristin Ford)称,其中一个提出投诉的组织是美国支持女性堕胎权组织(Naral Pro-Choice America),该组织通过自己的研究部门追踪反堕胎团体的活动。

福特表示,除了谷歌外,该组织也向其他几个科技平台提出过投诉,反映这些平台上出现的一些怀孕危机中心的广告、发布内容以及搜索结果具有误导性和欺骗性。一些这类组织声称能提供堕胎服务,但是却建议妇女不这么做。“他们不会明说自己的目的,”福特说道。

今年6月,谷歌更新了与堕胎有关的广告政策,根据其官网上公布的信息,新政策要求广告客户必须说明是否提供堕胎服务。福特表示,美国支持女性堕胎权组织并未事先被告知这项政策修改。

谷歌发言人莱文表示,谷歌并没有在堕胎相关查询中对怀孕危机中心的排名机制做出任何修改。

在今年7月到8月间,《华尔街日报》对“堕胎”的自然搜索结果做了总共17天测试。在39%的搜索结果首页能找到www.plannedparenthood.org这个域名。它属于美国计划生育协会(Planned Parenthood Federation of America),一个非盈利的女性堕胎权利组织。

相比之下,该组织的网址只出现在14%的Bing搜索结果首页和16%的DuckDuckGo搜索结果首页上。

莱文表示,谷歌并没有实施任何旨在支持美国计划生育协会的特定排名举措。

针对某些类型的网站或搜索创设黑名单,这种做法导致一些谷歌工程师和右翼出版机构激烈抨击谷歌存在政治倾向性。他们表示看过部分黑名单内容。《华尔街日报》看到的文件显示,在Google News似乎针对的网站里,有一些属于保守派的站点和博客。《华尔街日报》还看到一份黑名单的部分资料,一个不得出现在新闻或特色产品的名单中有几百个网站,其中包括Gateway Pundit、The United West等保守派和右翼网站,但这些网站可以在自然搜索中被搜到。

谷歌一直在反复重申,不会基于政治因素做出决定,谷歌的前员工以及在职员工也向《华尔街日报》表示,他们没有见到明显的政治倾向。然而,他们表示,谷歌的干预政策不断发生变化——而且这一点缺乏透明度——这不可避免地使员工变成裁判员,去决定什么可接受什么不能,这种两难境地会让谷歌受到存在偏见或倾向性的指控。

谷歌发言人莱文对此不予置评。

<figcaption>自2016年以来,各国政府向谷歌提出的修改要求迅速增加。/<figcaption>

据谷歌在其官网公布的报告称,其中接近78%的删除要求是2016年以来提出的。谷歌没有披露根据要求采取行动的情况。

数据显示,俄罗斯一直是要求最多的国家,仅仅去年一年,要求删除的链接就达到255,000条,占到各国政府要求删除总数的四分之三。《华尔街日报》在查阅伯克曼克莱因中心(Berkman Klein Center)一个数据库披露的资料后发现,俄罗斯提出的删除要求的依据几乎全都来自该国2017年生效的一部信息安全法。

谷歌表示,俄罗斯法律不允许其披露俄方要求删除哪些链接。一位知情者称,这些删除要求是针对俄罗斯因为各种原因而认定为非法的内容,例如宣扬药物使用,或者鼓励自杀等。

该人士还表示,相关要求可能包括删除那些指向俄罗斯政府定性为极端主义信息的链接,而这种做法可能被用来针对政治上的反对派。

该人士说,谷歌的评审人员有时候会拒绝那些看上去专门针对政治反对派的删除要求。这种情况下,谷歌会尽量不让这些决定引起关注,以免激怒俄罗斯监管部门。

此种做法在谷歌内部引发过激烈的争论。一方面,部分谷歌员工认为,对于俄罗斯或土耳其这类国家提出的删除要求,公司根本不应该配合;另一派人则认为,遵守各国当地法律是一条很重要的原则。

“对于一家私营公司该不该做出这种决定,公司内部的确有很大的疑问。”该人士说。

谷歌发言人莱文说:“最大化的信息获取一直是搜索的核心原则,这一点并没有改变。”

谷歌前任和在职员工表示,该公司公开抵制修改搜索结果的要求的企业文化已经逐渐消减。几年前,该公司解散了一支专注于言论自由问题的全球团队,该团队所做的事情包括公开宣传谷歌为抵制修改搜索结果而进行的法律斗争。据知情者透露,该团队的解散部分是由于谷歌在其中好几起诉讼中败诉。

“言论自由不再是胜利的一方。”该人士说道。