大数据时代:网民必须了解的上网信息隐私风险

阅读本文前,先提三个问题:

——你真的愿意用你的隐私信息,去交换使用互联网的便捷性吗?

——你知道在使用互联网平台或者APP应用时,平台应用是怎样获取你的隐私信息的吗?

——法律对网民的个人隐私信息的保护原则是怎样的呢?为什么我们的隐私经常被非法滥用?


一、李彦宏曾说:中国人愿意用隐私去交换便捷性。

随着互联网平台的兴盛,以及大数据和人工智能技术的日益强大,关于网民用户信息的隐私保护,可能也引发了越来越多的担忧和关注。

关于互联网平台用户信息隐私问题,李彦宏曾在一次高峰论坛中谈到,“我想中国人更加开放,对隐私问题没有那么敏感,如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的,那我们就可以用数据做一些事情。”

大数据时代:网民必须了解的上网信息隐私风险

(李彦宏的讲话)

李彦宏的话当时引起了中国网民和媒体的强烈不满,以至于百度公关道歉。但李彦宏说谎了吗?我想大家都心知肚明,李彦宏仅仅是陈述了当前中国互联网行业中存在的一个不太规范的事实现状而已。

但是这种现状无论对哪个阶层来说,都是不大能见光的,更不能对媒体场合公开谈及,尤其是还有歪果仁参加的媒体场合,可以说,李彦宏无意中CosPlay了一回“皇帝的新装”中的小孩,说了一句所有中国人都不爱听的大实话。

如果要细究起来,李彦宏的这番话可能同时得罪三类群体:

第一, 得罪ZF高层——因为这句话相当于说,国内的法治健全度不够,没有尽到保护网民群体数据信息隐私的职责!

第二, 得罪互联网平台——无论是BAT类互联网传统三巨头,还是TMD等三大互联网新贵,或者任何一家APP应用开发运营商,都没有一家平台愿意媒体去关注或讨平台对网民用户隐私保护等类的话题,因为这类话题一旦引发ZF高层的关注,那么这些互联网平台在大数据采集和使用等方面,都会难受很多。

第三, 得罪中国网民群体——李彦宏的话,也深深伤害了中国网民的自尊心。因为这等于在说中国网民大多素质不高,对自己的个人信息隐私问题根本不够重视,只要平台随便扔出三瓜两枣的利益或便捷性诱饵,网民就会双手奉上自己的隐私数据信息。

不得不说,李彦宏还真的是一个TOP级的技术宅,虽然智商超群,但比起马云大咖的情商来,估计中间差了10个周鸿祎。


二、互联网平台是如何获取用户的隐私信息的?

1、 用户明确主动自愿输入提交的个人信息

这类信息,主要以网站应用注册、电商订单收货地址等类型的信息居多。这个很好理解,比如我们上网购物,先得注册账户,因为涉及验证,所以手机和邮箱是最便捷且容易记住的账户名信息,也是当今平台最主流的注册账户名和验证方式二合一的产品实现路径。

大数据时代:网民必须了解的上网信息隐私风险

(注册多用手机,简便高效,但也存在隐私泄露风险)

注册完后,在下单时就必须填写真实的联系人、收货地址、手机号等联系方式了,而且用户在填写这些信息的时候,是十分清晰的知道,这些信息是提交给平台的。

因此,在此种清醒下,的确是用户自愿用记得隐私信息去交换网购的便捷性,而且这种交换,对用户和平台双方而言,都是合法规范的。平台自身的数据库服务器当然是可以存储用户此类隐私信息的。

但是同时,平台必须对用户的隐私信息负有严格的保密义务,不仅不得擅自向任何无关第三方透露,而且即使对平台内部员工,也是非工作必须的人员,都不得擅自授权获取。

2、 平台利用用户对隐私的认知模糊诱诱导迫使用户预授权或提交

这类情形中,最常见的是在APP应用下载安装之时,很多单一功能的小应用,都要用户授权一大堆手机上的涉及用户隐私的信息权限。

比如手机通讯录权限,相机、相册权限等,这几项是最常涉及用户隐私的授权。一个经常被大家拿来打趣的应用例子就是:一个简单的“手电筒”应用,都会要求包括上述一大堆的用户授权,才可以正常安装使用。

大数据时代:网民必须了解的上网信息隐私风险

(迫使用户许可隐私权限的霸王条款)

其实如果说微信、支付宝等相对正规的平台级APP,在用户使用的过程中,的确可能会涉及到读取用户手机通讯录的权限问题,比如在陌生人加你好友验证的时候,微信会识别用户来源。

这也是很多陌生人,在添加你的时候,为什么会显示“来自通讯录好友”或者“对方通过手机通讯录添加”——其实这个意思,并非你的手机通讯录上存有对方的手机号码,而是相反,对方把你的手机号码存到他自己的手机通讯录里了。

回到正题,像“手电筒”、“手机尺子”等类,功能及极其单一的应用,还真的没有必要获取用户的一些涉及隐私的权限授权。

而这种做法,其实一方面是利用了不少网民对授权信息的后果认知模糊的因素;另一方面,也的确有很多用户,在需要下载这类APP时,一般都是急需使用的,有时为了一时的便捷性,尽管明知APP的授权条件不合理,但抵不过自己急需使用这类APP的而紧迫性,就被迫同意了。——这也正是李彦宏所说的,很多用户愿意用自己的隐私信息或授权来换取一些便捷性的典型场景了。

3、 利用互联网平台的技术手段进行隐蔽获取

在用户上网时,经常用到的一个小技术叫COOKIES(以及服务器端的Session),我们平时上网的很多用户信息,基本都会暂存在用户自己本地的Cookies记录里面。

大数据时代:网民必须了解的上网信息隐私风险

(浏览器的Cookies隐私设置)

当你下次上网需要用到时,WEB服务器会直接从用户本地的Cookies里自动读取数据,比如:你的本地智能终端设备的MAC地址、上次登录过的账户名称、密码,浏览过的网页等,这既解决了用户的信息隐私问题,同时还大大提升了用户上网的便捷高效性。不用用户反复输入用户名和密码,或者昨天浏览过的网页,今天再打开时瞬间就可以浏览了。

对于这些Cookies上存储的信息,我们作为网民用户,有必要搞清楚一个很关键的问题——这些存储在用户本地的Cookies信息,我们并没有自动授权给平台方;也就是说,平台方无权擅自下载存储用户的Cookies数据信息到服务器数据库中。

平台系统只能被动的在用户访问平台应用时,用技术手段自动读取Cookies信息,这个过程是完全不需要人工参与的。也就是说,Cookies上的信息,理论上除了电脑手机等智能终端的相关应用程序知道外,平台的员工也是不知情的。

但问题在于,平台方即使采用技术手段记录存储用户的Cookies信息,用户是既无法知晓,也很难举证的。

2013年国内曾发生过“cookies”的一个诉讼案件——某位用户在使用百度搜索引擎搜索“减肥”“丰胸”等关键词并浏览相关内容之后,当用户再访问其他网站时,这些网站自动出现与用户曾搜索的关键词高度关联的广告。

大数据时代:网民必须了解的上网信息隐私风险

网站上的谷歌联盟广告,实时COOKIES追踪

(利用Cookies技术的谷歌联盟广告,截图前5分钟刚浏览的京东产品记录,在联合早报网被推荐出来了。)

用户认为百度未经其知情及许可,就擅自记录跟踪了其搜索的关键词,并且以广告匹配的形式,将其曾经的网络浏览轨迹或兴趣爱好等,展示在相关网站上,这侵害了其隐私权!

这个案件一审法院认定追踪Cookies行为属于侵犯隐私权,但二审法院却认为,Cookies若脱离了用户个人身份属性,不成立为隐私信息。

其实古一刀老师认为,二审法院的认定并不严谨:

首先,因为Cookies有很多方式与用户身份绑定的,即使不利用姓名、手机号码、身份证等信息,依然可以通过用户使用的智能终端设备的MAC地址或者IP地址等方式来追踪。

其次,如果Cookies信息真的彻底与用户个人属性分离,那怎么还会产生广告价值呢?百度为什么不会把“减肥”、“丰胸”等广告推荐给某位男性用户呢?这是最典型的一种平台利用用户隐私来谋取商业利益的一种行为。二审法院却认为并未涉及用户隐私。


三、平台能获取哪些类型的用户隐私信息?

既然是讨论互联网平台数据信息的隐私属性,那么我们下面就以数据信息的人身属性关联强弱度来对进行分类。看看我们上网时涉及的隐私数据有哪些类型?

(一)互联网平台会产生哪些类型的用户数据?

1、用户人身物理属性数据——身体的物理属性数据,如:年龄、身高、体重、三维等。

2、用户个人社交属性数据——手机号(通讯录)、其他社交IM账号、邮箱、住址(公司地址、亲友收货地址、出差常去城市和酒店位置)等。

3、用户个人兴趣偏好数据——上网时段、网络信息浏览偏好、网购偏好品类、消费金额(消费力)、用户终端设备数据等?

4、平台智能计算扩展数据——拥有大数据能力的平台,特别是那种积累了多年用户数据的互联网平台,比如BAT等,对用户隐私信息的智能计算能力是极其强大的。

大数据时代:网民必须了解的上网信息隐私风险

隐私泄露风险

从最直接的小例子说起,比如:

——可根据你买的奶粉,推测你有几个小孩以及小孩年龄;

——根据买轮胎选机油的记录掌握你的车型甚至车龄数据;

——根据你买衣服的款型码数、颜色款式、鞋码尺寸等,推算你的身高体重数;

——根据买机票、车票、或地图导航记录行车路线记录,可以准确的计算出你的上班公司地址、常出差的地址;以及常走访的亲友城市地址等。

再往大了点说,即使你不不直接输入姓名和身份证年龄等信息,大数据依然可以—

——通过你的购物消费记录或者亲友同学等社交记录,准确的计算出的你的出生年龄、出生地、小学到大学的学校等。

——甚至你的收入状况、财务状况、消费能力等,都是可以计算出来的范畴。

——再进一步深挖,甚至连某些人所拥有的小三状况,只要你有一些线上的联系、购物、支付等记录,也都是可以计算出来的,只是这个通常商业价值不典型,而且法律禁忌与后果太严重,没有平台敢冒天下之大不韪而已。


四、平台获取使用用户数据时的法律规定及责任义务

以上4种类型的数据,从法律上讲,全都是属于用户的个人隐私数据。

而隐私权是指——自然人享有的私人生活安宁与私人信息秘密依法受到保护,不被他人非法侵扰、知悉、收集、利用和公开的一种人格权,而且权利主体对他人在何种程度上可以介入自己的私生活,对自己的隐私是否向他人公开以及公开的人群范围和程度等具有决定权。

隐私权是一种基本人格权利,因此这些数据理所当然的归属于用户自己,而不属于平台。

1、平台不得擅自追踪或下载存储用户的Cookies隐私信息

从严格的法律意义上来讲,如果是平台利用互联网的技术交互方式,在用户访问平台时,自动识别用户的Cookies信息,这个是合理合法的。

大数据时代:网民必须了解的上网信息隐私风险

(用户访问平台,并不等于许可平台采集用户隐私数据)

但是这不等于平台的服务器就可以自动存储下载用户的隐私信息,或者未经用户许可而长期持续追踪用户的Cookies信息。

当然,法律只是一个威慑作用,真正实践中起决定作用的,还是网络技术实力。很多网民用户经常是不知道如何个性化的设置Cookies权限最合理高效,通常是基于浏览器的一些建议默认方案。因此某些互联网平台,特别是自身开发了浏览器产品的平台,更是具有先天优势了。

所以,法律规范对消费者隐私权的保护,通常是一些笼统概要的原则性要求,在没有具体针对性的法规条文或者司法解释明确出台之前,是很难规范到这些细节问题的。最难的当然在取证和举证环节了,即使举证责任倒置给平台方,在实践中也往往不会太顺利。

在平台擅自截留用户隐私信息问题上,也有一个典型的实例,前不久网上就有人提出疑问,自己在公司内部群的交流信息,若涉及商业机密,是否会轻易被微信或QQ截获?

对此问题,腾讯高管曾公开声明:微信不会保存用户的聊天记录信息,仅仅作为一个信息传输的管道,而不做信息数据的蓄水池!

但尽管如此,从技术上讲,像数据信息这种高度可复制共享的东西,要做一个存储备份,是分分钟都用不着的事。而且即使腾讯做了存储备份,除了国际机关或黑客外,一般人很难知情或取证。

当然,这些都是个人猜测,我相信腾讯一般不会对普通用户干这种事,因为法律风险太高,而且商业价值并不大,不值得这么做。

2、平台对合法获取的用户信息,必须要在合理必要且合法的原则上,审慎使用。

平台对于合法获取的用户隐私数据,也是要负有严格的保密义务;即便用户主动把他的隐私信息透露给平台,平台也得严格遵守用户隐私权益保护的法律规定,不可任意作为!

举个例子,即使你是某平台的会员,你主动把姓名、手机号码、身份证等信息都提交给了平台,但不等于平台可以随意使用你的信息,更不能把你的信息随意公开给平台员工,这是两码事!

大数据时代:网民必须了解的上网信息隐私风险

首先,平台自己在使用用户数据信息时,也不得超出合理必要的范围,比如平台掌握了用户的邮箱或者电话,如果偶尔给用户发个促销信息广告,也无可厚非;但若超出一定的频次,或对用户的日常生活造成一定的负面影响或干扰,也会涉嫌滥用用户数据信息。

其次,即使平台因业务需要把用户信息透露给自己的员工时,也都必须起到审慎保密的义务,公开透露的员工范围以合理必要为基本前提。而不是任何员工想要就可以获得的。

但难点就在于:这个“合理必要”的描述仍然只是一个定性的抽象原则,具体执行标准尺度,仍然是靠企业自己掌握,或者只能等到发生争议时,由法院等司法机构来裁定。

最后,平台不得擅自把用户数据透露给任何无关第三方主体,除司法执法机构外。

平台基本不会无缘无故的把自有用户信息透露给无关第三方的,但是如果平台因商业需要,与第三方相互置换共享用户隐私信息,这种情形就相当常见了。

不过平台很少直接交出自己的用户数据库的,而大多是通过程序接口调用的方式,根据合作业务需要实时从平台调用相关的用户信息。

这种实现方式相对而已,对用户隐私信息的侵犯不那么明显或比较隐蔽,如果没有发生什么意外或者严重的事件后果,一般很少有人追究责任,因而在司法实践中也较少案例,或者认定标准版不够清晰明确。


五、小结

单独来看,网民一些独立碎片化的信息,很多都算不上特别关键或重要隐私;但是如果平台常年累月积累了某个ID用户的大量数据,那么这个ID用户对平台而言,就是平台最熟悉的陌生人了!甚至会比这个ID用户的某些亲朋好友,甚至老同学更了解这位用户。

在像BAT等顶级平台面前,那些综合网龄超过5年且上网频繁的老网民,简直就像个透明人一样,并没有太多的隐私而言,只是没有技术人员特意去调阅你的个人网络隐私档案而已!

大数据时代:网民必须了解的上网信息隐私风险

(大数据时代的电商网页“千人千面”)

或者换一个角度,电商的“千人千人”用户画像功能,其实把用户的多层级分类属性信息,都逐一调研分析个遍,只是他们仅仅提取采用了对平台业务有商业价值的部分信息内容而已,而对其他过于敏感或者商业价值不高的信息,选择了过滤和忽视而已。

即使作为一个拥有10多年的资深网民,虽然也知道互联网平台是如何收集用户数据信息的,但我在保护自己的网络信息隐私方面,依然也一样束手无策。

这种状况,能否用文章开头李彦宏的那句话——很多中国网民,可能会愿意用自己的隐私去交换一些便捷性的——来解释呢?我想李彦宏的这个说法其实不准确的,准确的说,应该吧“愿意”换成“被迫无奈的默许”更恰当一些!


分享到:


相關文章: