龐大的簡歷數據庫讓這家公司“點石成金”

庞大的简历数据库让这家公司“点石成金”

■廖木興/製圖

擁有簡歷累計37億份、超10億份通訊錄、8億自然人認知數據

起底大數據灰色產業鏈 1

當今社會正處於大數據時代,公眾也理所當然地接受了這個現實。基本上任何商業模式,只要扯上“大數據”,就好像鍍了層金般價值飈升,認為掌握了通往大金礦的鑰匙。然而,對一般用戶來說,有多少人清楚或瞭解,自己就是這個大金礦中的一粒金砂呢?在大數據淘金者手中,每個人都可能每時每刻都在被篩選、分析、畫像、評價、共享、交易、推銷……我們可能知道,也可能從不被告知,就算知道了,也無力阻止。

今年3月25日,號稱中國最大的簡歷大數據公司、曾獲李開復旗下創新工場投資的巧達科技(北京)有限公司(以下簡稱“巧達”)被警方一鍋端,所有員工均被帶走。

本文覆盤的巧達商業模式中的問題操作,都基於巧達公開資料所做的合理推斷,並非為針對巧達公司,而是為引申說明、呈現一條存在多年的簡歷大數據灰色產業鏈。

■新快報記者 鄭志輝

1

“獲取簡歷、數據變現”

公開資料顯示,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷數據庫,擁有2.2億自然人的簡歷、簡歷累計總數37億份。此外,還有超過10億份通訊錄,並且掌握著與此相關的社會關係、組織關係、家庭關係數據。結合簡歷、通訊錄,以及外部獲取的超過千億條其他用戶數據,巧達自稱擁有超過8億自然人的認知數據。

巧達是如何將這座數據富礦點石成金的呢?“我們的商業模式概括起來也就8個字:獲取簡歷、數據變現。”巧達高管劉博曾在2015年公開表示。

根據媒體得到的一份巧達當時的商業夥伴計劃介紹文件,巧達將這些數據用在教培、保險、招聘等行業,某大型地產公司、某職業教育培訓機構、某分類信息網站和幾家招聘網站在這份文件裡被列為典型案例。

2016年,巧達科技全年收入1.2億元,淨利潤4800萬元;2017年,巧達科技全年收入4.11億元,淨利潤1.86億元,淨利潤率超過45%。

巧達顯然從一開始就清楚這種大數據生意即使在當時也是可能觸碰到法律紅線,並且早有準備的。2015年,巧達高管曾在給客戶介紹數據合規性時表示:簡歷中不存在民法規定的個人隱私信息,巧達只分析簡歷信息中的個人教育經歷和個人求職經歷兩部分,是屬於“個人可向公眾開放並知悉”的信息,且數據使用時會經過脫敏處理,還稱公司COO劉煒曾是中國最大的在線法律服務平臺盈科律雲的創始人,在法律方面把關格外嚴謹。

而我國從2018年5月1日起才正式實施的《信息安全技術個人信息安全規範》,其中對“個人敏感信息”的標準寄予明確說明:個人敏感信息包括身份證件號碼、個人生物識別信息、銀行賬號、通信記錄和內容、財產信息、徵信信息、行蹤軌跡、住宿信息、健康生理信息、交易信息等。

此外,《規範》也對個人信息使用做出明確規定,無論直接還是收集、收取用戶個人信息時,都需要有個人授權,還應瞭解授權的同意範圍,包括使用目的(如只能用於特定招聘網站的人事招聘、獵頭業務),個人信息主體是否授權同意轉讓、共享、公開披露等。

2

三大數據獲取手段惹爭議

巧達的大數據生意如此受歡迎,其中的核心在於,傳統的用戶畫像靠的是上網特徵、媒體及購物偏好等相對模糊的信息,但巧達依據的是個人簡歷和通訊錄,通過自然人數據打通了一般用戶個人信息以及敏感信息,其用戶畫像精準到了每個人,以及他們完整的關係網絡。

在巧達當年的那份商業夥伴計劃書中,提到其數據獲取主要有三大途徑,並且都是合法的:自有招聘網站、招聘工具產品和第三方數據源。

有法律專家指出,不管是巧達還是第三方公司的招聘工具,超過為用戶直接推薦工作機會之外的用途,都需要取得用戶的明確許可,否則就屬於擅自利用用戶信息並可能侵犯隱私。

一種途徑是巧達曾經提供的服務之一——簡歷共享,即HR或者獵頭把自己用不到的簡歷上傳換取積分,再用積分下載平臺上有用的簡歷。法律專家認為,HR並非這些簡歷的所有者,簡歷數據歸屬於求職者,如果用簡歷到平臺上換取積分,這與買賣簡歷本質上無差別。

還有人推測,巧達在用爬蟲的方式抓取其他招聘網站的簡歷數據,因為巧達長期在招聘爬蟲工程師,其崗位職責包括“設計爬蟲策略和防屏蔽規則,解決封賬號、封IP、驗證碼等難點攻克,負責網頁信息抽取、清洗、消重和結構化處理等工作”。法律專家認為,如果有公司在未經同意的情況下抓取用戶簡歷,該行為不僅涉嫌侵犯用戶的隱私權,情節嚴重的涉嫌構成侵犯公民個人信息罪。

更進一步的數據交易是,巧達很可能拿著手中免費得來的簡歷數據和擁有其他類型數據的數據公司進行了交換,有行業人士指出,“數據交易行業裡,簡歷數據屬於比較貴的數據”,巧達可能藉此拿到了通訊錄數據、消費數據等其他數據。

3

一份精準營銷數據可賣0.5-2元一條

最簡單的商業模式可能就是直接的數據交易。舉例來說,巧達已經掌握了你的簡歷數據並且建立了一定的用戶畫像,在此基礎上,通過和某些調用過通訊錄的工具類APP合作,掌握你的社交網,以此找到和你消費能力相匹配的商家“精準營銷”。

如某職業教育培訓機構每日新增15萬線索號碼,但僅有手機號+簡單信息,面臨需求不明、付費率低、無效溝通增加成本、等問題。巧達可以自動補全意向學員的資料信息,將學員線索按照關係分配給課程顧問,並且發現學員通訊錄中有培訓需求的人。更進一步,還可以將課程學員號碼進行產品特徵建模,得出最適合該客戶的前幾位課程。有業內人士透露過,此類通過通訊錄匹配、標記畫像後的數據,提供給商家用於精準營銷的收費在0.5元-2元/每條。

另外一種交易數據的方式是“賣”給求職者的老闆們。巧達在2015年推過一項在職場中一片罵聲的服務“愛夥伴”——讓公司CEO提前知道員工離職。企業每年支付一定費用用於監測員工,一旦有員工在各大招聘網站上有信息更新,投遞簡歷,或資料被獵頭頻繁查看,系統後臺就會預警,“該員工很有可能打算跳槽或者被人挖走”。

討論

誰來保護大數據時代的 渺小個體?

在法律機關最後結果出來之前,我們並不能就此下定論巧達的商業模式都是違法的。事實上,在大數據行業,對用戶隱私的保護,存在太多的灰色空間,讓有意藉此牟利的人遊刃有餘了。

互聯網企業與其他企業、商家交易用戶精準營銷數據違法嗎?只要“不具有個人識別性”就是合法的。經過加工處理後的數據財產權,到底是歸屬於數據的生產者,還是原始數據的擁有者?國內外至今均無明確規定。

用戶能不能拒絕互聯網企業將自己的簡歷數據用於交換或者交易?以智聯招聘APP為例,用戶在註冊時已開宗明義“註冊代表您已同意《智聯服務協議》和《隱私條款》”,而服務協議中已經列明,其不但可以在不公開姓名的情況下,可以向第三方提供綜合性的非個人化信息資料,對用戶數據庫進行分析並予以商業化的利用,而且對業務合作伙伴公司獲得個人信息及之後個人信息的使用不承擔任何法律責任。

離職預警的業務是否違法?有律師說,“尚處於法律灰色地帶”。所以,從2015年至今,提供類似服務的互聯網公司絡繹不絕,如HR家、互推網、人才啊、小魚HR助手小程序等等。

簡歷數據如此,那更敏感的病歷、學歷、購房者、理財用戶大數據呢?2018年7月,山東成功破獲一起特大侵犯公民個人信息案,被稱為“大數據行業第一股”的新三板上市企業數據堂被指“在8個月時間內,日均傳輸公民個人信息1億3千萬餘條”,還曾以眾包模式,用每條0.2元的價格公開採集病歷信息。截至發稿時,該案尚未宣判。


分享到:


相關文章: