大數據公司“生死劫”:致命模式一夜歸零

這是《中國經營報》為您分享的第1010篇原創文章;我們只發有態度,有乾貨的原創。

大数据公司“生死劫”:致命模式一夜归零

退一步可能海闊天空,進一步卻可能跌入深淵。

深受公眾質疑的大數據公司正面臨著生死考驗,之所以飽受質疑,是因為他們掌握著大量的個人信息甚至隱私,而這些個人信息又經常被侵犯和轉賣,賣房、賣車、貸款甚至催收等各種信息令公眾不勝其煩;與此同時,正規的金融機構們在風控中又離不開大數據的支撐,尤其是網絡信貸和個人信貸。

最終,國家相關部門在2019年下半年開始對大數據行業大力整頓。

不過,經過2019年整肅風暴後的數據行業向何處走,現實仍舊沒有給出明確答案。

近日,有消息稱知名大數據公司的裁員蔓延至國際部門,部分員工受到波及。事實上,大數據行業自去年下半年以來一直動盪不斷。行業內員工被抓捕、被調查、被裁員及主動離職的消息不斷傳出。

一家北京頭部數據公司內部人士向《中國經營報》記者證實,“優化”確實在發生。“由於數據核驗業務目前不能做了,這部分人力要向評分、建模、語音質檢方面去轉。”

“年前已經集中面試了一批來自此前涉事頭部數據公司的求職者,崗位涉及銷售、數據分析、建模等各個板塊。其實不需要等著被裁,從業者們也會及時脫身。”一位國資背景數據公司高管透露。

行業整肅風波未平,涉及個人金融信息政策持續收緊,伴隨疫情籠罩,數據行業何去何從?

模式停擺:“拿不到數據了”

去年以來由爬蟲整肅風波引起的數據荒還在持續。

“現在業內風聲很緊,整肅風波後,已經沒有數據源敢開放數據的接口給第三方數據公司了,尤其是此前的涉事機構,這直接導致大批數據公司此前最依賴的通道類業務停擺。此外,對於沒有數據源的大數據公司,爬蟲業務的全部下線導致的業務調整是必然。”前述高管向記者表示。

在互聯網信貸鏈條中,不論是註冊審核還是放貸前的風控審核,對於客戶提交的個人信息真實性核實都是第一步,包含對姓名、身份證、手機號、銀行卡等信息的核實,除此之外,還要了解該名客戶的其他個人畫像,比如不良記錄、資產、工作、學歷、朋友圈等多維度數據,在獲得客戶授權的前提下,信貸機構可以通過從數據公司調用上述信息快速完成對借款人風險把控。在商業模式上,通常按照調用數據或者報告的次數計費,此前數據行業的頭部公司可以達到每天百萬級甚至更高的調用量。這項業務模式簡單,卻佔據大部分數據公司七成以上的業務規模。

業內人士告訴記者,此前第三方數據公司依靠自身爬取或者對接數據源,能夠支撐每日海量高頻的數據調用,但從數據來源看,多數無法深究。“肯定有合規來源,但大多數不合規。可能有交換的、可能有從黑產買來的,但大部分是‘爬’來的。”隨著行業風聲驟緊,這些數據的合法合規性受到質疑,數據供給和業務模式受到直接衝擊。

前述高管告訴記者:此前市場上的大數據公司,按照服務模式不同,主要分三大類:第一類,數據通道代理類公司,上游有可靠的數據源,以代理方式直接與數據源對接,以“批發零售”的方式對外開展服務,這些機構多有接近數據源頭的資源背景。第二類,以合規或非合規技術手段收集數據,通過對拿到的數據做加工整合、變量處理,形成自身的數據產品後再對外提供。第三類,是擁有較強的大數據處理和研發能力,為金融機構提供大數據建模層面的諮詢和技術系統搭建類服務。三種主要類別之外,還存在著大量數據販子等灰色產業。

“查詢數據是有成本的,以身份驗證每次一毛到三毛的市場平均價,數據公司或互金平臺每天為此花費數萬元甚至數十萬元是相當常見的。因此大家通過各種手段壓低成本,既包括‘爬’或者找黑產買,也包括把‘經手’的數據留存下來進行‘再利用’,一旦形成規模效應,相關數據產品的報價甚至可以低至幾分錢。”一位上海徵信行業資深人士透露。

記者採訪瞭解到,在國內大數據立法真空背景下,此前幾乎七成以上的公司核心展業模式都是以爬蟲技術為手段、以買賣客戶數據為利潤支柱,近年來快速做大了業務量。

但去年以來,爬蟲業務下線和傳統互金客群範圍萎縮形成了惡性循環。記者從某上海數據公司人士處瞭解到,隨著監管方面的全面排查,目前全行業的爬蟲技術,以及公安系統法律訴訟信息等相關服務都已經停止,因此部分原先以爬蟲相關服務著稱的企業受到影響最大。“此前這些大數據公司的客戶五成為現金貸平臺,現在整個行業的業務量縮減了一半,加之目前疫情的影響,業務推進是走一步看一步。”

前述國資數據公司高管就直言:此前一些大數據公司的反欺詐業務做得確實很好,但未來數據成本變高了、一部分業務不能做了,一些上過黑名單的數據公司銀行與其合作會有顧慮,都會擠壓數據公司的生存空間。

緩存可“致命”

“從去年10月以來,行業人心惶惶。公司合規部和律師也在不斷研判法律法規,去年的《個人金融信息(數據)保護試行辦法》徵求意見稿,還有不久前央行下發的《個人金融信息保護技術規範》,業內大家一直在學習,但也沒法給出完全合規的意見,只能先停下一部分業務。”前述北京頭部數據公司內部人士表示。

記者從一家機構人士處得到這份去年10月下發的《個人金融信息(數據)保護試行辦法》徵求意見稿。從中可以看到,該意見稿對個人金融信息的採集、使用、存儲進行了明確規定,因此也被認為是對當前大數據產業鏈影響最直接的一份文件。

該意見稿中明確規定,“(金融機構)不得從非法從事個人徵信業務活動的第三方獲取個人金融信息”。對於個人金融信息,包括但不限於自然人的身份信息、財產信息、賬戶信息、信用信息、金融交易信息以及其他反映特定自然人某些情況的信息。“這個概念外延非常大,幾乎包攬所有敏感信息維度,而合法徵信業務的資質目前也只有百行徵信擁有,其他數據公司怎麼做?”一位股份行人士表示。

此外,該意見稿中信息存儲的要求對數據行業同樣致命。意見稿明確規定:“金融機構保存個人金融信息不得超出實現業務目的所必需的最短時問,超出該最短保存時間後,應當及時刪除個人金融信息或者對其進行匿名化處理”。

“簡單而言,就是隨用隨調,調後馬上刪除,杜絕緩存。”前述國資機構高管告訴記者,此前不管是三方數據公司對上下游獲取的數據還是銀行對本行用戶的數據,都會留存進行二次開發,而“緩存數據”實質是支撐起數據公司業務模式的關鍵一環。

記者注意到,此前很多大數據公司的宣傳重點之一即在於“毫秒級”的數據調用能力。該高管就直言:如果沒有留存數據,哪能有這麼快的響應速度?靠臨時採集,以後這些業務還能開展嗎?

如果將市場大數據行業的鏈條拆解,可以從源頭到下游梳理出一串參與者:數據源,主要是公安、社保、運營商、銀行等掌握身份要素的官方渠道,也包括一些自身產生數據的互聯網巨頭;上游則是一批具有一定資源背景的數據代理商,以兜售數據接口為模式,也不乏一些層層轉包的接口販子以及數據黑產公司;中游,由一批市面上耳熟能詳的大數據公司盤踞,但他們的業務範疇囊括上下游多個環節;中下游,是一些單純提供風控技術解決方案的公司;下游則是包括銀行、信託、消費金融公司、互金平臺等數據需求部門。

而“緩存信息”的動作,使得下游發出身份查詢需求,經過的每一級,可能都會涉及留存數據,這實質也侵犯了行業上下游的利益和用戶的個人隱私。

因此,如果嚴格執行上述規則,數據公司不能違規拿數、不能留數,理論上對提供的數據必須說明數據源頭、得到源頭授權,直接從採集和存儲上將第三方數據公司“卡脖子”。“但現實中很多上游拿不出合法合規的授權內容。”該高管表示。

業內也憂慮,這不僅可能將目前的三方大數據公司“一夜歸零”,甚至會波及銀行獲客催收等業務條線。

轉型關鍵是成本

低成本高回報的業務普遍停擺,大數據公司未來靠什麼撐起估值和運營?

上述北京頭部數據公司人士透露:不做核驗類,不直接參與數據調用環節,業務轉向信用評分、AI建模、風控諮詢、語音質檢、語音識別等業務,涉及領域也開始從金融向政務和其他行業拓展。“這部分主要輸出模型、算法,看不到具體數據,只生成風控結果,因此不存在太大風險。”

不過這條路可能也並不容易。前述國資數據公司高管就透露:雖然給銀行金融機構提供諮詢和外包的模式此前數據公司也做,但其實這項業務是和前端身份核驗等“數據通道”類業務包在一起做的,銀行和數據公司合作的前提也是這些大數據公司已有大量數據,並且數據是動態的、實時更新的。

而輸出建模和風控諮詢模式下,不涉及數據調用,只能提供服務。這一市場上,目前包括第四範式、冰鑑科技、壹賬通、中誠信等都有參與,因此大數據公司的優勢並不明顯。

重點是,對大數據公司而言,這項業務的性價比不高。此前,數據公司由於坐擁低成本數據,可以拉低整體服務對銀行的報價。現在核心的前端業務沒了,單純諮詢類服務想報高價並不容易。

“一個銀行諮詢項目從50萬元到500萬元不等,最常見的是100萬元以下。數據公司此前報價敢報得非常低,是因為他們在數據上賺到了錢。而諮詢外包業務模式重,數據不出銀行前提下,數據公司必須派人員駐行,一個項目至少兩三個人,持續三個月,基本也就做到不虧錢。”該高管表示。

一位互金行業風控從業者就透露:目前數據成本在急劇攀升。此前可以直接從大數據公司或者上游代理渠道調用,但現在很多接口關停,就只能轉而通過數據融合的形式聯合建模,基本沒有法律風險,但成本高。而且現在爬蟲禁用,他們少了最重要的一塊數據,評分效果也一般了。

記者 李暉 蔣牧雲

中國經營報旗下垂直於互聯網金融領域的全媒體平臺。已經入駐微信公眾號,今日頭條,一點資訊,百度百家,網貸之家,新浪財經頭條、網貸天眼、網易、騰訊等媒體平臺。致力於為互聯網金融從業者和投資者提供有價值的內容產品。


分享到:


相關文章: