大数据时代,我们要如何避免AI偏见?

最近,包括墨客星球在内,众多媒体纷纷报道了携程“杀熟”事件,一位携程用户用携程购买机票,他发现第二次点击购买的价格比第一次点击购买时要贵很多,于是他便将自己的发现公布到了社交网络上,并引起了巨大轰动。人们纷纷指责携程在定价方面因人而异,并怀疑其“利欲熏心”,向价格敏感度不高的老客户收取了更高的费用。

虽然事后携程方面多次声明称没有杀熟,只是误会,只是一个BUG。“但从本质上来说,这件事反映出了在AI、大数据时代,人们对AI偏见(或者是AI歧视)的巨大担忧。”近日,在百度“致胜AI营销”沙龙中,雨本智库发起人杜玉杰先生如此分析。

大数据时代,我们要如何避免AI偏见?

其实,此类关于AI偏见的事件早已发生不止一次,杜玉杰先生表示,去年年底,国民老公王思聪为庆祝iG夺冠,派发了113万元大奖,每人1万元的奖金,2500万人参与,但令人惊奇的是,最终中奖的113人中,居然有112人都是女生,而且在这113人中,使用苹果手机的用户占78%,而苹果手机在全国范围内的占有率只有10%。为此,不少网友开始质疑起抽奖活动的公正性;“而在更早之前,微软聊天机器人Tay在Twitter上居然被网友教成了一个具有种族歧视、满嘴脏言秽语的小怪物,这些事件逐渐让AI偏见问题成为行业关注的热点。”杜玉杰先生认为,AI偏见在人工智能时代几乎是无处不在的。

“那么,为什么创建一个无偏见的AI这么难?”杜玉杰抛出了这么一个问题。

“机器学习不同与传统基于规则的算法,我以红绿灯为例试图简单地解释这两种算法的区别,传统算法相当于只要设计一个‘红灯停绿灯行’的规则就行了,而人工智能则是希望根据车流量数据训练出一个模型,帮助规定具体什么时候亮红灯,以及亮多久。”杜玉杰表示当数据不足或者不全面时,将会对模型的训练产生巨大影响,其中就可能包括AI偏见等问题。

关于由数据产生的偏见问题,杜玉杰先生还专门提到了⾟普森悖论,如下图所示,两个学院的个别录取率男皆⼤于⼥,但是总体录取率男却远⼩于⼥。这意味着同样一组数据,当你基于不同纬度进行分析时,有可能分析出两种完全不同的结论,而这可能也是数据偏见产生的另一个原因。

当然,AI偏见产生的原因除了数据以外,杜玉杰还提到了另外两个原因:算法偏见以及人的偏见。

“目前市面上有很多不同的算法,比如谷歌的算法可以理解成‘人机算法’,即根据人机交互数据训练得到的算法,而类似的,Facebook的也可以理解成‘人人算法’,此外还有全局算法,场景最优算法等,这意味着不同的算法其实都有着各自不同的局限性,而有局限就意味着有偏见,有歧视。”对此,杜玉杰还举例加以说明,“比如要验证一个商家到底是不是黑心商户,你用某个复杂的算法来算或许还不一定算出结果,但你如果去直接问上过当的小白,分分钟其实就能真相大白。”

不过,不管是数据偏见还是算法偏见,在杜玉杰看来,归根结底这都是人的偏见。

大数据时代,我们要如何避免AI偏见?

那么,我们应该如何避免AI偏见呢?

对此,杜玉杰给出建议:1、算法编写时必须要清楚地意识到偏见的存在;2、模型训练的目标不应压榨大众而应帮助大众。

杜玉杰认为,AI偏见其实也并不是总会产生不好的结果,实际上,只要掌握上述两点,AI偏见可能也会产生一些正面的价值。比如《纸牌屋》 的成功,就归功于奈飞公司利用算法分析了从2500万用户那里收集的数据,发现了人们喜欢观看的节目类型具有某种倾向性和相关性。 杜玉杰认为,只要最终的目的是为了给用户更多的快乐与享受,是对用户有好处的,即使有偏差也不要紧。

当然,关于如何避免AI偏见的话题还没有结束,再往上走可能就要上升到AI伦理以及法律的层面上来了。

“2016年9月 Google、Facebook、IBM、亚 马逊和微软五大科技巨头成立了Partnership on AI 组织,该组织将制定一些AI伦理上的规范,从而防止AI被恐怖组织滥用等。另外,欧盟也修改了数字版权法,致力于保护用户数据。”杜玉杰认为通过AI伦理以及法律法规,也可以在一定程度上避免AI偏见。

另外,后谷歌时代的分布式商业必定会带来更多的机遇,或许也能为AI偏见问题带来更多新的内容。

最后,杜玉杰引述吉尔德的观点认为人工智能可能只是一种无厘头式的狂欢,在哥德尔不完备定理 、图灵停机问题 、以及量子力学中的不确定性原理还存在着诸多质疑和争论的情况下,电脑永远无法真正的思考或是具有意识, 创造力只能来自于人类思维。

但即便如此,杜玉杰认为人类在未来也将不可避免地受到AI算法的影响,而在这种情况下,AI算法至少应该遵守以下原则:

1、人工智能不应该伤害人;

2、人工智能不应该歧视人 ;

3、人工智能不应该“操纵”人 ;

4、人工智能不应该完全取代人 !


分享到:


相關文章: