大數據危險（一）：看看APP對你的隱私，都做了什麼科技頭條網

大數據危險（一）：看看APP對你的隱私，都做了什麼

圖侵刪

導讀：

App已經成為大眾常用的軟件工具，它給我們的生活提供了不少便利。但大眾不知道的是，它還扮演著另外一個身份——大數據這頭巨獸收集數據的"觸手"。

當你安裝App的時候，你需要閱讀一份上千字的隱私協議，必須點擊勾選「我已閱讀並同意上述條款」，才能進行下一步。然而大家往往不會看這些條款，所以也不知道究竟同意了什麼條款。

這些條款是徵求對你手機上的數據使用權限，主要包含：位置信息、通訊錄、照片等等。理論上，只要你同意，它們都可以被 App 們任意地採集和分析。

其中App能獲取的權限分為普通權限和危險權限。

普通權限有140項，它你安裝時不需要經過用戶同意就可以獲取。比如控制你的振動傳感器和日曆數據。

而更敏感的危險權限則分為9組，在使用App時會和你再次確認使用權限的授權，而這些授權徵詢基本都是一次後永久使用的，比如讀取通訊錄、訪問照片、相機使用、位置信息等等。

但以上只是理論而已，現實是很多App越過了紅線！

根據艾媒諮詢發佈的《2020年中國手機App隱私權限測評報告》，當前多數手機App仍存在強制超範圍索要權限的情況，97%的App默認調用相機權限；35%的App默認調用讀取聯繫人權限。這些可是危險權限，而且這還不是個別案例！

2019年11月，工信部開展App侵害用戶權益專項整治工作，並在2019年12月-2020年1月，兩次通報存在問題的App共56款，包括QQ閱讀、一點資訊、拉勾招聘等

違法超範圍索要權限，到底是為了什麼？

"答案是，為了用戶數據"。

"就這麼簡單？"

"對，就這麼簡單！"

你感到驚訝是因為不知道，用戶數據對互聯網公司來說，意味著什麼。

蘋果會對 1% 的用戶採集他們和Siri的幾秒對話錄音，用於改善Siri 的識別準確率。

輸入法類App會收集用戶常用詞彙，以優化輸入效率。

網約車會通過用戶的位置數據，方便平臺調度車輛的分佈，達到最佳覆蓋效果。

多數App調用讀取聯繫人權限，可為用戶提供應用內實名好友推薦，以增加用戶數的擴張。

用戶數據是互聯網公司以最低成本，優化產品體驗、迭代產品、實現用戶數增長的最佳方式。用戶數據越多他們對用戶的行為偏好分析越準確，迭代出的產品越符合用戶需求。用戶數據就是互聯網公司的命根。

或許有人會說，這不是挺好的事兒嗎？優化產品對用戶也是好事呀。

"但如果數據洩露了呢？"

"怎麼可能？互聯網公司們的安全都是完成過認證，其中最重要的是 ISO/IEC 27001。作為全球公認的最高信息安全標準，27001 包含了信息安全、人力安全、物理安全在內的 14 個模塊。安全係數這麼高的，怎麼可能被洩露？"

"那，如果是內部洩露呢？"

"也不可能！只要涉及核心數據，員工入職時都是需要簽訂保密協議的。況且內部洩露也只是極小個例."

"很遺憾，用戶數據你可以在網上，很容易就買到。只需幾百塊，就可以買到3-4G的數據包。說不定這數據包，有你的數據……"

由於很多小公司用戶基數不大，但又需迭代產品，那就只有通過買數據了，這種需求就造成"數據黑市"。

用戶數據另外還會用於餵養大數據這頭洪水巨獸，讓它完成量變到質變的升級，可怕的事情才真正開始。

首先你得知道大數據是什麼？別把大數據想成什麼高大上的東西，它的原理其實很簡單。

想象一個無限大的游泳池，它的旁邊站著三個管理員。各種各樣的數據就像是五顏六色的水。第一個管理員負責把彩色的水抽進來，第二個管理員按照顏色把彩色的水進行分類，第三個管理員把整理好的水根據需求拿出來使用。

第一個管理員是大數據的拾取數據算法，第二個就是整理分類製作標準模型的算法，第三個就是調取使用、對比模型、計算結果輸出。

大數據的本質就是一堆足夠大的數據的集合，加上幾類算法。

那大數據的量變到質變，如何體現的呢？

舉個例子：

你只是在網上買了一隻口紅，很簡單的一條信息對吧？可是大數據通過數據樣本對比，馬上就會知道你很多信息。根據口紅的款式，知道你是什麼年齡階段的女性。根據口紅的價格，能預估你的消費能力，從而推算出你的收入範圍。根據你的收貨地址，大致能判斷你的生活環境、生活在幾線城市、生活水平如何，再從你地址周圍其他消費者的情況交叉對比，會知道你填地址是小區還是辦公樓等等。

後續隨著信息的增加，加上噪聲算法排除那些沒有用的信息，大數據會在系統中，會越來越清晰準確地勾勒出你的特徵。

這種能力，就好比我們在門縫中，只看到一個懸空的手，根據我們的常識和經驗，立馬推斷出門後站了一個人。

數據模型對比和降噪算法排除，就好比我們的經驗和常識。即使你在生活中，是一個十分注重隱私的人，這種能力也能利用僅有的信息把你扒得褲衩都不剩。

"等等！你不是說大數據危險嗎？從面來看，不是沒有傷害到我們的實際利益？"

"著什麼急啊，不是才（一）嗎？我會在（二）中，給你講壞人是如何利用大數據佔你便宜的！"

補充擴展：

從2019年開始，我國就非常重視App侵害用戶隱私的問題，開展多次審查行動並通報處罰了多家企業，同時發佈相關文件規定。但在數據海進行監管，這難度實在太大，不能光靠相關部門，我們作為用戶也要行動起來，發現侵權及時舉報，共同創造一個良好的用戶環境。

分享到:

閱讀更多 愛科學的M叔 的文章

關鍵字: 巨獸大數據算法