大數據時代:網民必須瞭解的上網信息隱私風險

閱讀本文前,先提三個問題:

——你真的願意用你的隱私信息,去交換使用互聯網的便捷性嗎?

——你知道在使用互聯網平臺或者APP應用時,平臺應用是怎樣獲取你的隱私信息的嗎?

——法律對網民的個人隱私信息的保護原則是怎樣的呢?為什麼我們的隱私經常被非法濫用?


一、李彥宏曾說:中國人願意用隱私去交換便捷性。

隨著互聯網平臺的興盛,以及大數據和人工智能技術的日益強大,關於網民用戶信息的隱私保護,可能也引發了越來越多的擔憂和關注。

關於互聯網平臺用戶信息隱私問題,李彥宏曾在一次高峰論壇中談到,“我想中國人更加開放,對隱私問題沒有那麼敏感,如果他們願意用隱私交換便捷性,很多情況下他們是願意的,那我們就可以用數據做一些事情。”

大數據時代:網民必須瞭解的上網信息隱私風險

(李彥宏的講話)

李彥宏的話當時引起了中國網民和媒體的強烈不滿,以至於百度公關道歉。但李彥宏說謊了嗎?我想大家都心知肚明,李彥宏僅僅是陳述了當前中國互聯網行業中存在的一個不太規範的事實現狀而已。

但是這種現狀無論對哪個階層來說,都是不大能見光的,更不能對媒體場合公開談及,尤其是還有歪果仁參加的媒體場合,可以說,李彥宏無意中CosPlay了一回“皇帝的新裝”中的小孩,說了一句所有中國人都不愛聽的大實話。

如果要細究起來,李彥宏的這番話可能同時得罪三類群體:

第一, 得罪ZF高層——因為這句話相當於說,國內的法治健全度不夠,沒有盡到保護網民群體數據信息隱私的職責!

第二, 得罪互聯網平臺——無論是BAT類互聯網傳統三巨頭,還是TMD等三大互聯網新貴,或者任何一家APP應用開發運營商,都沒有一家平臺願意媒體去關注或討平臺對網民用戶隱私保護等類的話題,因為這類話題一旦引發ZF高層的關注,那麼這些互聯網平臺在大數據採集和使用等方面,都會難受很多。

第三, 得罪中國網民群體——李彥宏的話,也深深傷害了中國網民的自尊心。因為這等於在說中國網民大多素質不高,對自己的個人信息隱私問題根本不夠重視,只要平臺隨便扔出三瓜兩棗的利益或便捷性誘餌,網民就會雙手奉上自己的隱私數據信息。

不得不說,李彥宏還真的是一個TOP級的技術宅,雖然智商超群,但比起馬雲大咖的情商來,估計中間差了10個周鴻禕。


二、互聯網平臺是如何獲取用戶的隱私信息的?

1、 用戶明確主動自願輸入提交的個人信息

這類信息,主要以網站應用註冊、電商訂單收貨地址等類型的信息居多。這個很好理解,比如我們上網購物,先得註冊賬戶,因為涉及驗證,所以手機和郵箱是最便捷且容易記住的賬戶名信息,也是當今平臺最主流的註冊賬戶名和驗證方式二合一的產品實現路徑。

大數據時代:網民必須瞭解的上網信息隱私風險

(註冊多用手機,簡便高效,但也存在隱私洩露風險)

註冊完後,在下單時就必須填寫真實的聯繫人、收貨地址、手機號等聯繫方式了,而且用戶在填寫這些信息的時候,是十分清晰的知道,這些信息是提交給平臺的。

因此,在此種清醒下,的確是用戶自願用記得隱私信息去交換網購的便捷性,而且這種交換,對用戶和平臺雙方而言,都是合法規範的。平臺自身的數據庫服務器當然是可以存儲用戶此類隱私信息的。

但是同時,平臺必須對用戶的隱私信息負有嚴格的保密義務,不僅不得擅自向任何無關第三方透露,而且即使對平臺內部員工,也是非工作必須的人員,都不得擅自授權獲取。

2、 平臺利用用戶對隱私的認知模糊誘誘導迫使用戶預授權或提交

這類情形中,最常見的是在APP應用下載安裝之時,很多單一功能的小應用,都要用戶授權一大堆手機上的涉及用戶隱私的信息權限。

比如手機通訊錄權限,相機、相冊權限等,這幾項是最常涉及用戶隱私的授權。一個經常被大家拿來打趣的應用例子就是:一個簡單的“手電筒”應用,都會要求包括上述一大堆的用戶授權,才可以正常安裝使用。

大數據時代:網民必須瞭解的上網信息隱私風險

(迫使用戶許可隱私權限的霸王條款)

其實如果說微信、支付寶等相對正規的平臺級APP,在用戶使用的過程中,的確可能會涉及到讀取用戶手機通訊錄的權限問題,比如在陌生人加你好友驗證的時候,微信會識別用戶來源。

這也是很多陌生人,在添加你的時候,為什麼會顯示“來自通訊錄好友”或者“對方通過手機通訊錄添加”——其實這個意思,並非你的手機通訊錄上存有對方的手機號碼,而是相反,對方把你的手機號碼存到他自己的手機通訊錄裡了。

回到正題,像“手電筒”、“手機尺子”等類,功能及極其單一的應用,還真的沒有必要獲取用戶的一些涉及隱私的權限授權。

而這種做法,其實一方面是利用了不少網民對授權信息的後果認知模糊的因素;另一方面,也的確有很多用戶,在需要下載這類APP時,一般都是急需使用的,有時為了一時的便捷性,儘管明知APP的授權條件不合理,但抵不過自己急需使用這類APP的而緊迫性,就被迫同意了。——這也正是李彥宏所說的,很多用戶願意用自己的隱私信息或授權來換取一些便捷性的典型場景了。

3、 利用互聯網平臺的技術手段進行隱蔽獲取

在用戶上網時,經常用到的一個小技術叫COOKIES(以及服務器端的Session),我們平時上網的很多用戶信息,基本都會暫存在用戶自己本地的Cookies記錄裡面。

大數據時代:網民必須瞭解的上網信息隱私風險

(瀏覽器的Cookies隱私設置)

當你下次上網需要用到時,WEB服務器會直接從用戶本地的Cookies裡自動讀取數據,比如:你的本地智能終端設備的MAC地址、上次登錄過的賬戶名稱、密碼,瀏覽過的網頁等,這既解決了用戶的信息隱私問題,同時還大大提升了用戶上網的便捷高效性。不用用戶反覆輸入用戶名和密碼,或者昨天瀏覽過的網頁,今天再打開時瞬間就可以瀏覽了。

對於這些Cookies上存儲的信息,我們作為網民用戶,有必要搞清楚一個很關鍵的問題——這些存儲在用戶本地的Cookies信息,我們並沒有自動授權給平臺方;也就是說,平臺方無權擅自下載存儲用戶的Cookies數據信息到服務器數據庫中。

平臺系統只能被動的在用戶訪問平臺應用時,用技術手段自動讀取Cookies信息,這個過程是完全不需要人工參與的。也就是說,Cookies上的信息,理論上除了電腦手機等智能終端的相關應用程序知道外,平臺的員工也是不知情的。

但問題在於,平臺方即使採用技術手段記錄存儲用戶的Cookies信息,用戶是既無法知曉,也很難舉證的。

2013年國內曾發生過“cookies”的一個訴訟案件——某位用戶在使用百度搜索引擎搜索“減肥”“豐胸”等關鍵詞並瀏覽相關內容之後,當用戶再訪問其他網站時,這些網站自動出現與用戶曾搜索的關鍵詞高度關聯的廣告。

大數據時代:網民必須瞭解的上網信息隱私風險

網站上的谷歌聯盟廣告,實時COOKIES追蹤

(利用Cookies技術的谷歌聯盟廣告,截圖前5分鐘剛瀏覽的京東產品記錄,在聯合早報網被推薦出來了。)

用戶認為百度未經其知情及許可,就擅自記錄跟蹤了其搜索的關鍵詞,並且以廣告匹配的形式,將其曾經的網絡瀏覽軌跡或興趣愛好等,展示在相關網站上,這侵害了其隱私權!

這個案件一審法院認定追蹤Cookies行為屬於侵犯隱私權,但二審法院卻認為,Cookies若脫離了用戶個人身份屬性,不成立為隱私信息。

其實古一刀老師認為,二審法院的認定並不嚴謹:

首先,因為Cookies有很多方式與用戶身份綁定的,即使不利用姓名、手機號碼、身份證等信息,依然可以通過用戶使用的智能終端設備的MAC地址或者IP地址等方式來追蹤。

其次,如果Cookies信息真的徹底與用戶個人屬性分離,那怎麼還會產生廣告價值呢?百度為什麼不會把“減肥”、“豐胸”等廣告推薦給某位男性用戶呢?這是最典型的一種平臺利用用戶隱私來謀取商業利益的一種行為。二審法院卻認為並未涉及用戶隱私。


三、平臺能獲取哪些類型的用戶隱私信息?

既然是討論互聯網平臺數據信息的隱私屬性,那麼我們下面就以數據信息的人身屬性關聯強弱度來對進行分類。看看我們上網時涉及的隱私數據有哪些類型?

(一)互聯網平臺會產生哪些類型的用戶數據?

1、用戶人身物理屬性數據——身體的物理屬性數據,如:年齡、身高、體重、三維等。

2、用戶個人社交屬性數據——手機號(通訊錄)、其他社交IM賬號、郵箱、住址(公司地址、親友收貨地址、出差常去城市和酒店位置)等。

3、用戶個人興趣偏好數據——上網時段、網絡信息瀏覽偏好、網購偏好品類、消費金額(消費力)、用戶終端設備數據等?

4、平臺智能計算擴展數據——擁有大數據能力的平臺,特別是那種積累了多年用戶數據的互聯網平臺,比如BAT等,對用戶隱私信息的智能計算能力是極其強大的。

大數據時代:網民必須瞭解的上網信息隱私風險

隱私洩露風險

從最直接的小例子說起,比如:

——可根據你買的奶粉,推測你有幾個小孩以及小孩年齡;

——根據買輪胎選機油的記錄掌握你的車型甚至車齡數據;

——根據你買衣服的款型碼數、顏色款式、鞋碼尺寸等,推算你的身高體重數;

——根據買機票、車票、或地圖導航記錄行車路線記錄,可以準確的計算出你的上班公司地址、常出差的地址;以及常走訪的親友城市地址等。

再往大了點說,即使你不不直接輸入姓名和身份證年齡等信息,大數據依然可以—

——通過你的購物消費記錄或者親友同學等社交記錄,準確的計算出的你的出生年齡、出生地、小學到大學的學校等。

——甚至你的收入狀況、財務狀況、消費能力等,都是可以計算出來的範疇。

——再進一步深挖,甚至連某些人所擁有的小三狀況,只要你有一些線上的聯繫、購物、支付等記錄,也都是可以計算出來的,只是這個通常商業價值不典型,而且法律禁忌與後果太嚴重,沒有平臺敢冒天下之大不韙而已。


四、平臺獲取使用用戶數據時的法律規定及責任義務

以上4種類型的數據,從法律上講,全都是屬於用戶的個人隱私數據。

而隱私權是指——自然人享有的私人生活安寧與私人信息秘密依法受到保護,不被他人非法侵擾、知悉、收集、利用和公開的一種人格權,而且權利主體對他人在何種程度上可以介入自己的私生活,對自己的隱私是否向他人公開以及公開的人群範圍和程度等具有決定權。

隱私權是一種基本人格權利,因此這些數據理所當然的歸屬於用戶自己,而不屬於平臺。

1、平臺不得擅自追蹤或下載存儲用戶的Cookies隱私信息

從嚴格的法律意義上來講,如果是平臺利用互聯網的技術交互方式,在用戶訪問平臺時,自動識別用戶的Cookies信息,這個是合理合法的。

大數據時代:網民必須瞭解的上網信息隱私風險

(用戶訪問平臺,並不等於許可平臺採集用戶隱私數據)

但是這不等於平臺的服務器就可以自動存儲下載用戶的隱私信息,或者未經用戶許可而長期持續追蹤用戶的Cookies信息。

當然,法律只是一個威懾作用,真正實踐中起決定作用的,還是網絡技術實力。很多網民用戶經常是不知道如何個性化的設置Cookies權限最合理高效,通常是基於瀏覽器的一些建議默認方案。因此某些互聯網平臺,特別是自身開發了瀏覽器產品的平臺,更是具有先天優勢了。

所以,法律規範對消費者隱私權的保護,通常是一些籠統概要的原則性要求,在沒有具體針對性的法規條文或者司法解釋明確出臺之前,是很難規範到這些細節問題的。最難的當然在取證和舉證環節了,即使舉證責任倒置給平臺方,在實踐中也往往不會太順利。

在平臺擅自截留用戶隱私信息問題上,也有一個典型的實例,前不久網上就有人提出疑問,自己在公司內部群的交流信息,若涉及商業機密,是否會輕易被微信或QQ截獲?

對此問題,騰訊高管曾公開聲明:微信不會保存用戶的聊天記錄信息,僅僅作為一個信息傳輸的管道,而不做信息數據的蓄水池!

但儘管如此,從技術上講,像數據信息這種高度可複製共享的東西,要做一個存儲備份,是分分鐘都用不著的事。而且即使騰訊做了存儲備份,除了國際機關或黑客外,一般人很難知情或取證。

當然,這些都是個人猜測,我相信騰訊一般不會對普通用戶幹這種事,因為法律風險太高,而且商業價值並不大,不值得這麼做。

2、平臺對合法獲取的用戶信息,必須要在合理必要且合法的原則上,審慎使用。

平臺對於合法獲取的用戶隱私數據,也是要負有嚴格的保密義務;即便用戶主動把他的隱私信息透露給平臺,平臺也得嚴格遵守用戶隱私權益保護的法律規定,不可任意作為!

舉個例子,即使你是某平臺的會員,你主動把姓名、手機號碼、身份證等信息都提交給了平臺,但不等於平臺可以隨意使用你的信息,更不能把你的信息隨意公開給平臺員工,這是兩碼事!

大數據時代:網民必須瞭解的上網信息隱私風險

首先,平臺自己在使用用戶數據信息時,也不得超出合理必要的範圍,比如平臺掌握了用戶的郵箱或者電話,如果偶爾給用戶發個促銷信息廣告,也無可厚非;但若超出一定的頻次,或對用戶的日常生活造成一定的負面影響或干擾,也會涉嫌濫用用戶數據信息。

其次,即使平臺因業務需要把用戶信息透露給自己的員工時,也都必須起到審慎保密的義務,公開透露的員工範圍以合理必要為基本前提。而不是任何員工想要就可以獲得的。

但難點就在於:這個“合理必要”的描述仍然只是一個定性的抽象原則,具體執行標準尺度,仍然是靠企業自己掌握,或者只能等到發生爭議時,由法院等司法機構來裁定。

最後,平臺不得擅自把用戶數據透露給任何無關第三方主體,除司法執法機構外。

平臺基本不會無緣無故的把自有用戶信息透露給無關第三方的,但是如果平臺因商業需要,與第三方相互置換共享用戶隱私信息,這種情形就相當常見了。

不過平臺很少直接交出自己的用戶數據庫的,而大多是通過程序接口調用的方式,根據合作業務需要實時從平臺調用相關的用戶信息。

這種實現方式相對而已,對用戶隱私信息的侵犯不那麼明顯或比較隱蔽,如果沒有發生什麼意外或者嚴重的事件後果,一般很少有人追究責任,因而在司法實踐中也較少案例,或者認定標準版不夠清晰明確。


五、小結

單獨來看,網民一些獨立碎片化的信息,很多都算不上特別關鍵或重要隱私;但是如果平臺常年累月積累了某個ID用戶的大量數據,那麼這個ID用戶對平臺而言,就是平臺最熟悉的陌生人了!甚至會比這個ID用戶的某些親朋好友,甚至老同學更瞭解這位用戶。

在像BAT等頂級平臺面前,那些綜合網齡超過5年且上網頻繁的老網民,簡直就像個透明人一樣,並沒有太多的隱私而言,只是沒有技術人員特意去調閱你的個人網絡隱私檔案而已!

大數據時代:網民必須瞭解的上網信息隱私風險

(大數據時代的電商網頁“千人千面”)

或者換一個角度,電商的“千人千人”用戶畫像功能,其實把用戶的多層級分類屬性信息,都逐一調研分析個遍,只是他們僅僅提取採用了對平臺業務有商業價值的部分信息內容而已,而對其他過於敏感或者商業價值不高的信息,選擇了過濾和忽視而已。

即使作為一個擁有10多年的資深網民,雖然也知道互聯網平臺是如何收集用戶數據信息的,但我在保護自己的網絡信息隱私方面,依然也一樣束手無策。

這種狀況,能否用文章開頭李彥宏的那句話——很多中國網民,可能會願意用自己的隱私去交換一些便捷性的——來解釋呢?我想李彥宏的這個說法其實不準確的,準確的說,應該吧“願意”換成“被迫無奈的默許”更恰當一些!


分享到:


相關文章: