大數據危險(一):看看APP對你的隱私,都做了什麼

圖侵刪


導讀:

App已經成為大眾常用的軟件工具,它給我們的生活提供了不少便利。但大眾不知道的是,它還扮演著另外一個身份——大數據這頭巨獸收集數據的"觸手"。


當你安裝App的時候,你需要閱讀一份上千字的隱私協議,必須點擊勾選「我已閱讀並同意上述條款」,才能進行下一步。然而大家往往不會看這些條款,所以也不知道究竟同意了什麼條款。


這些條款是徵求對你手機上的數據使用權限,主要包含:位置信息、通訊錄、照片等等。理論上,只要你同意,它們都可以被 App 們任意地採集和分析。

大數據危險(一):看看APP對你的隱私,都做了什麼


其中App能獲取的權限分為普通權限危險權限


普通權限有140項,它你安裝時不需要經過用戶同意就可以獲取。比如控制你的振動傳感器和日曆數據。

而更敏感的危險權限則分為9組,在使用App時會和你再次確認使用權限的授權,而這些授權徵詢基本都是一次後永久使用的,比如讀取通訊錄、訪問照片、相機使用、位置信息等等。


但以上只是理論而已,現實是很多App越過了紅線!

大數據危險(一):看看APP對你的隱私,都做了什麼


根據艾媒諮詢發佈的《2020年中國手機App隱私權限測評報告》,當前多數手機App仍存在強制超範圍索要權限的情況,97%的App默認調用相機權限;35%的App默認調用讀取聯繫人權限。這些可是危險權限,而且這還不是個別案例!


2019年11月,工信部開展App侵害用戶權益專項整治工作,並在2019年12月-2020年1月,兩次通報存在問題的App共56款,包括QQ閱讀、一點資訊、拉勾招聘等


違法超範圍索要權限,到底是為了什麼?

"答案是,為了用戶數據"。

"就這麼簡單?"

"對,就這麼簡單!"


你感到驚訝是因為不知道,用戶數據對互聯網公司來說,意味著什麼。


蘋果會對 1% 的用戶採集他們和Siri的幾秒對話錄音,用於改善Siri 的識別準確率。

輸入法類App會收集用戶常用詞彙,以優化輸入效率。

網約車會通過用戶的位置數據,方便平臺調度車輛的分佈,達到最佳覆蓋效果。

多數App調用讀取聯繫人權限,可為用戶提供應用內實名好友推薦,以增加用戶數的擴張。


用戶數據是互聯網公司以最低成本,優化產品體驗、迭代產品、實現用戶數增長的最佳方式。用戶數據越多他們對用戶的行為偏好分析越準確,迭代出的產品越符合用戶需求。用戶數據就是互聯網公司的命根。


或許有人會說,這不是挺好的事兒嗎?優化產品對用戶也是好事呀。

大數據危險(一):看看APP對你的隱私,都做了什麼

"但如果數據洩露了呢?"


"怎麼可能?互聯網公司們的安全都是完成過認證,其中最重要的是 ISO/IEC 27001。作為全球公認的最高信息安全標準,27001 包含了信息安全、人力安全、物理安全在內的 14 個模塊。安全係數這麼高的,怎麼可能被洩露?"


"那,如果是內部洩露呢?"


"也不可能!只要涉及核心數據,員工入職時都是需要簽訂保密協議的。況且內部洩露也只是極小個例."


"很遺憾,用戶數據你可以在網上,很容易就買到。只需幾百塊,就可以買到3-4G的數據包。說不定這數據包,有你的數據……"


由於很多小公司用戶基數不大,但又需迭代產品,那就只有通過買數據了,這種需求就造成"數據黑市"。


用戶數據另外還會用於餵養大數據這頭洪水巨獸,讓它完成量變到質變的升級,可怕的事情才真正開始。

大數據危險(一):看看APP對你的隱私,都做了什麼

首先你得知道大數據是什麼?別把大數據想成什麼高大上的東西,它的原理其實很簡單。

想象一個無限大的游泳池,它的旁邊站著三個管理員。各種各樣的數據就像是五顏六色的水。第一個管理員負責把彩色的水抽進來,第二個管理員按照顏色把彩色的水進行分類,第三個管理員把整理好的水根據需求拿出來使用。

第一個管理員是大數據的拾取數據算法,第二個就是整理分類製作標準模型的算法,第三個就是調取使用、對比模型、計算結果輸出。

大數據危險(一):看看APP對你的隱私,都做了什麼

大數據的本質就是一堆足夠大的數據的集合,加上幾類算法。


那大數據的量變到質變,如何體現的呢?


舉個例子:

你只是在網上買了一隻口紅,很簡單的一條信息對吧?可是大數據通過數據樣本對比,馬上就會知道你很多信息。根據口紅的款式,知道你是什麼年齡階段的女性。根據口紅的價格,能預估你的消費能力,從而推算出你的收入範圍。根據你的收貨地址,大致能判斷你的生活環境、生活在幾線城市、生活水平如何,再從你地址周圍其他消費者的情況交叉對比,會知道你填地址是小區還是辦公樓等等。


後續隨著信息的增加,加上噪聲算法排除那些沒有用的信息,大數據會在系統中,會越來越清晰準確地勾勒出你的特徵。


這種能力,就好比我們在門縫中,只看到一個懸空的手,根據我們的常識和經驗,立馬推斷出門後站了一個人。

數據模型對比和降噪算法排除,就好比我們的經驗和常識。即使你在生活中,是一個十分注重隱私的人,這種能力也能利用僅有的信息把你扒得褲衩都不剩。


"等等!你不是說大數據危險嗎?從面來看,不是沒有傷害到我們的實際利益?"


"著什麼急啊,不是才(一)嗎?我會在(二)中,給你講壞人是如何利用大數據佔你便宜的!"


補充擴展:

從2019年開始,我國就非常重視App侵害用戶隱私的問題,開展多次審查行動並通報處罰了多家企業,同時發佈相關文件規定。但在數據海進行監管,這難度實在太大,不能光靠相關部門,我們作為用戶也要行動起來,發現侵權及時舉報,共同創造一個良好的用戶環境。


分享到:


相關文章: