数据“黑市”流转,加密算法如何解痛?

数据“黑市”流转,加密算法如何解痛?

文|武旭升

你并没有买房需求,房屋销售的电话动不动就打进来,话筒里的甜美声音直接叫出了你的名字。

你连澳门都没去过,号称要“改变你人生”的博彩推广短信就发到了你的手机上。

你只是在淘宝上浏览过一条碎花洋裙,登陆微博时,各种裙子的热卖信息出现你的浏览页里。

大数据时代下,信息泄露和数据画像下的精准营销,时不时让人有一种隐私被侵犯的危机感,无可奈何又无处躲藏。

徐茂桐也经常会被垃圾电话和短信骚扰,成为区块链项目ARPA的创始人之前,他曾在复星锐正资本担任高级投资经理,参与过很多金融科技和大数据领域的投资。

相比普通人,他更了解数据交易市场供需不平衡的痛点,这一痛点催生了获取暴利的“中间商”。而牟利的刺激下,可复制的数据极有可能在“黑市”中流转,成为不法人员的赚钱工具。

当区块链技术成为热点时,徐茂桐最先想到的应用方向就是数据交换,“有没有一种算法可以与区块链结合,让数据不曝光。”

MPC密码协议让他们看到了可能性,它是一种专门针对数据安全的多方计算解决方案,不断迭代下,ARPA诞生,试图结合区块链来解决数据隐私的问题。

数据交易市场的伪命题

“在一家星级宾馆的套房里,几个男人看着一小堆被彻底砸烂的计算机硬盘,露出了轻松的笑容,这意味着他们的任务已经彻底完成。”

2018年1月,《财经》在报道中国数据交易被黑市垄断的现象时,用上述文字描述了国内一家互联网电商公司和一家保险公司交易大数据的场景。

双方在交易完成后,对于包含源数据的硬盘,不仅做格式化数据删除,还要当着彼此的面进行物理损坏,互相见证拷贝出的数据仅一次性使用,不可能再外泄。

这样的场景在徐茂桐看来,并非数据交易市场上的高频行为,“更普遍的情况是大多数公司不愿意将自己的数据拿出来交易,更不可能共享。”

在创立ARPA之前,徐茂桐在VC投资基金复星锐正担任高级投资经理,从业过程中看过很多做科技金融和大数据方面的初创公司和项目,深知数据对于不少互联网企业来说已经成了基本命脉。

数据“黑市”流转,加密算法如何解痛?

“比如我们之前投的做现金贷的公司,他们有自己的数据,也有风控需求,希望跟其他公司做数据交换,不过他们不能把自己的黑名单(数据)分享给别人。”徐茂桐介绍,这种“不能”既有法律的要求,也有行业竞争的考虑。

2017年6月1日,《网络安全法》正式施行,单独成章(第四章)为保护用户信息提供法律依据,以法条的方式规定,“任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息”。

而人们在使用一些互联网产品时,手机号、身份证号等个人信息和消费记录等等都成了企业的数据。按照法律规定,这些带有个人信息的数据禁止交易。

企业双方无法交易数据,但又存在市场需求,数据中介顺势而期。既有如数据堂这样的数据服务提供商,也有如贵阳大数据交易所这样的政府部门和国资背景的平台。中间机构对数据做处理后供有需求的企业获取。

“我们了解,像贵交所每年可能有几千万的抽成收入,从这个数字看,数据交易是个伪命题。”徐茂桐认为,当企业不愿拿出自己的数据时,合法途径下的数据流通就无法完成,数据交易的商业模式也就无法成立。

另一大痛点是数据价格不菲,“比如,数据交易中介公司会把收集来的黑名单拿过来整合,提供给有需求的B端客户,客户需要数据时都过来找他们查,他们不产生数据,但是从中获取很大一部分利润,1毛钱的一条信息可能会买到1块钱。”

高额交易费用也让数据交易形成黑色产业链,包含个人隐私的数据具有“可复制”的特点,它们在黑产中一次又一次被转卖。

贵阳大数据交易所执行副总裁朱国辉在接受《财经》采访时表示,“如果说我们正规军提供一条身份证验真服务成本就要一块钱,那么数据黑产从业者的报价只有几毛钱,切走了很大一部分市场。”

“多方加密计算”打通数据流通

徐茂桐认为,数据无法自由流通起来的原因是的所有权和使用权无法绑定在一起,“数据可见即所得。”

痛点之下,他的思考是“怎么才能让你只用一次这个数据,但你又看不到这个数据,或者说你没有办法来复制传播”。

2017年,区块链突然被业内捧出了“技术革命”的意味。徐茂桐注意到它时,第一个想法是能否用来做数据交换,“重点是用区块链技术来解决数据安全的问题。”

这个设想在区块链创业领域并不新鲜,用区块链技术做数据安全尝试的项目诸多。

徐茂桐也注意到了这些项目,“当时看到行业里的项目都没有从根本上解决问题,无论在传输的过程中怎么加密,但是使用者只要拿到数据,他就可以看到别人的隐私,能复制后在链下分享。”

2017年底,他团队开始尝试各种加密算法,试图寻找“数据流通但不曝光”的解决方案。

数据“黑市”流转,加密算法如何解痛?

去年4月,MPC密码协议(Secure Multi-Party Computation)开始作为一种尝试。这一秘密学解决方案翻译过来叫做安全多方计算,这是一种保护数据安全隐私的算法,使用这种算法加密数据后,任何第三方都无法查看,但是可以分析和调用数据。

MPC密码协议也就成了区块链项目ARPA“最硬核”的技术实力。

徐茂桐解释,MPC协议的运算过程是分布式的密文计算,“整个过程不解密,作为结果只给到某一方,可以保证数据源的隐私。”

今年2月,MPC的测试网络上线,并在工程意义上完成了场景验证。

徐茂桐举了一个具体的场景案例。比如,一家银行想要查询张三在不在别家银行的黑名单里,在隐私保护的要求下,张三这个名字不能暴露,如果他真的在两家银行的黑名单上,银行的名字也不能暴露。

这一场景下,多家银行可以联合在一起,利用MPC来做一次密文搜索,“整个过程中,数据不需要提供给任何一方,都在银行自己的服务器上。我们会用一个密云分享的方式,将要搜索的内容和被搜索的库做一个数据预处理,这些处理是密文的,以碎片的方式进行运算,得出他们最终想要的结果——张三在黑名单上。”

在大数据时代下,数据即权利的趋势已经越来越明显。徐茂桐认为,ARPA的MPC密码协议可以实现数据所有权和使用权的分离。

当前,ARPA正在帮中国信通院,制定安全多方计算MPC的国家标准,协作方中有百度、阿里巴巴的蚂蚁金服,“最近腾讯也加入进来了。”

在商业规划上,徐茂桐和团队的规划是先2B再2C。“目前的应用是企业级的,比如金融行业的黑名单共享,银行、保险行业的联合征信等等。”

ARPA更长远的打算是让普通人能通过他们的产品实现个人的数据保护和利用,“比如有广告主想要一个人数据,他需要向用户支付Token才能获取数据调取的权利,当然,这个数据仍然是加密的。”


分享到:


相關文章: