01.15 姚前:區塊鏈高質量發展與數據治理

姚前:區塊鏈高質量發展與數據治理 | 互聯網金融

怎麼發展好區塊鏈是當前亟須回答的關鍵命題。本文認為,先從數據存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支持公有鏈的研究,為了防範風險,須改造公有鏈。基於現實環境,聯盟鏈或許是應用落地的較優選擇。應加強國產密碼算法應用和創新發展,以保障我國區塊鏈安全可控。當前最重要的是,我們應提倡區塊鏈的高質量發展,為此,需要加強鏈上和鏈下數據治理(Data Governance),建立有效的區塊鏈數字治理體系。

習近平總書記在中共中央政治局第十八次集體學習的講話內涵豐富,思想深邃。他敏銳地抓住現代信息技術發展的前沿熱點,強調要加快推動區塊鏈技術和產業創新發展,高屋建瓴地提出我國區塊鏈技術發展藍圖,為我們指引了方向。同時他又要求客觀辯證地看待創新技術的“雙刃劍”效應,強調要加強對區塊鏈技術的引導和規範,加強風險研究和分析,加強行業自律,落實安全責任,依法治鏈,推動區塊鏈安全有序發展。

應該說,要不要發展區塊鏈,已無爭議,怎麼發展才是當前亟須回答的關鍵命題。本文認為,先從數據存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支持公有鏈的研究,基於現實環境,聯盟鏈或許是應用落地的較優選擇。密碼學是區塊鏈技術的重要基石,應加強國產密碼算法應用和創新發展,以保障我國區塊鏈安全可控。當前最重要的是,我們應提倡區塊鏈的高質量發展,為此,需要加強鏈上和鏈下數據治理(Data Governance),建立有效的區塊鏈數字治理體系。

先從數據存證、共享入手,逐步向價值網絡發展,是務實的落地策略

從現階段技術成熟度看,區塊鏈在價值轉移方面,還存在性能上的爭議,但其本身就是一個點對點的數據共享網絡,因此其在數據存證、共享方面的適用性存在較少分歧。在總書記的重要講話中,促進數據共享是他指出的五大區塊鏈作用之一,也是他強調的區塊鏈重點應用方向。利用區塊鏈數據可信優勢,建立數據存證、共享的創新模式,可實現政務數據跨部門、跨區域共同維護和利用,促進城市地區在信息、資金、人才、誠信等方面更大規模的互聯互通,保障生產要素在區域內有序高效流動,提升城市管理的智能化、精準化水平。

但是區塊鏈技術本身對數據高度冗餘的要求,客觀上增加了計算與存儲開銷;另外,區塊鏈技術在數據透明方面的特性,須結合安全多方計算、同態加密、零知識證明等隱私保護技術,才能在各方自主可控前提下大範圍應用,而隱私保護技術本身的效率還在提高過程中。

因此,當前比較合理的實現方法是鏈上共享數據的Hash指紋存證與信息披露,真實數據按照“數據不出門、數據不落地、數據可用不可見”三原則,依託安全隱私保護技術在鏈下按照授權來共享使用。將來隨著基礎設施與安全技術的進步,有計劃地將系統和受保護的真實數據遷移到區塊鏈上,進而發展成為價值網絡。

技術研究在公有鏈,場景應用在聯盟鏈

從私有鏈到聯盟鏈、公有鏈,社區信任程度逐步遞減,相應帶來的技術難題(比如共識機制、性能問題、隱私保護等)逐步遞增。私有鏈類似於傳統信息系統,聯盟鏈是相互信任的機構之間的互聯互通,介於去中心化和中心化之間,根據業務場景的要求,不一定只採用POS或POW,可採用PBFT等傳統共識機制,也可以採用多種共識協議相結合的混合共識機制,Libra即是聯盟鏈。而公有鏈的相互信任程度最低,高度開放和容錯下的安全和性能挑戰所要求的技術水平最高。公有鏈的前沿技術突破,將為聯盟鏈和私有鏈現有技術問題提供新的解決方案。因此,就學術而言,區塊鏈的技術創新關鍵點更多的是在公有鏈上。支持公有鏈的研究,推進聯盟鏈的應用,是我國區塊鏈發展戰略的應有之義。

以監管科技應對金融科技,是區塊鏈治理的應對之道

可以說,區塊鏈的去中心化對金融監管提出了全新的命題和挑戰,完全開放自由的公有鏈存在合規風險,如承載金融科技應用則必須予以改進。應對之道或許是以監管科技應對金融科技,聯盟鏈是許可鏈,既可以開展跨機構應用,也可為行業自律和監管提供服務。有鑑於此,可考慮在不損害區塊鏈技術優勢的前提下,在公有鏈上增加監管節點,保障公有鏈的合法合規,或者採用多鏈策略,即採用聯盟鏈+公有鏈的“二元模式”,聯盟鏈向相關監管部門註冊,開展鏈上監管,去中心化應用則使用公有鏈,開展去中心化商業活動。若有需要,監管者亦可從聯盟鏈穿透到公有鏈,管控全局。基於依法合規的現實要求,聯盟鏈或許是應用落地的較優選擇。

國產密碼算法的應用和創新發展,是我國區塊鏈安全可控的基礎

本質上,區塊鏈是一個基於密碼學原理的分佈式共享存儲與計算系統,其對中心化機構的揚棄和對密碼學技術的依賴,標誌著一種全新範式的控制權的轉移。就這一個角度而言,國產密碼算法的應用和創新發展,意義重大。關鍵領域的區塊鏈應用,密碼學技術必須符合國家密碼標準。

目前,國家密碼局公佈的中國自主研發的國家商用密碼算法,包括SSF33、SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖沖之密碼算法(ZUC)等。其中SSF33、SM1、SM4、SM7、ZUC是對稱算法;SM2、SM9是非對稱算法;SM3是哈希算法。國密算法有優點,但也有需要改進的地方。以SM2為例,相比傳統的橢圓曲線簽名算法ECDSA,兩者的簽名和驗籤的核心步驟相近,SM2簽名驗證算法加入了較多的檢錯功能,提高了簽名驗證系統的數據完整性、系統可靠性和安全性;與廣泛應用的RSA數字簽名算法相比,SM2在同等安全強度下所需密鑰位數更少,且密鑰對生成速度,簽名速度均優於RSA數字簽名算法。但SM2也有其劣勢,比如驗籤速度相比RSA處於明顯的劣勢,尚需改進。

目前國密算法還沒有覆蓋到同態加密、零知識證明、多方安全計算等,亟須拓展相應國密算法庫,並實現標準化。而隨著我國區塊鏈應用跨出國門,國密算法也應一併走向世界,成為國際標準。這些都對我國國密算法提出了更高的要求。

雖然區塊鏈的應用是去中心化的,但區塊鏈的密碼標準體系是由特定的機構來制定的。某種意義上,誰掌握了密碼標準體系,誰就掌握了區塊鏈發展的話語權。

加強鏈上和鏈下數據治理,是現階段推動區塊鏈高質量發展的關鍵

如前述所言,數據的互聯互通應是現階段區塊鏈技術的重點應用方向,聯盟鏈或將是其主要形式。但我們應提倡區塊鏈的高質量發展,警惕“大幹特幹,一擁而上”的無序低質量發展。需要強調的是,區塊鏈上的數據應該是具備較高價值的可公開的不宜修改的數據。這是它的特性,更是它的優勢和品質所在。若無謂地把無價值的且可隨意更改的數據上鍊,實際上是對區塊鏈技術的濫用,也無法構建起符合實際業務需求的應用。為此,我們需要建立有效的區塊鏈數據治理體系,以保障區塊鏈應用的質量和品質。

通俗來說,數據治理是指所有為提高數據質量而展開的業務、技術和管理活動,包括組織架構、政策制度、技術工具、數據標準、流程規範、監督考核等。國際數據管理協會(DAMA)的《數據管理知識體系指南(DMBOK)》則將數據治理框架定義為數據控制、數據架構管理、數據開發、數據操作管理、數據安全管理、數據質量管理、參考數據和主數據管理、數據倉庫和商務智能管理、文件和內容管理、元數據管理等10個方面。針對區塊鏈技術的特性,或許可從以下幾個方面入手,構建區塊鏈數據治理體系:

第一,加強鏈下數據治理的評估與監督,防止短板效應

區塊鏈技術可以解決鏈上的信任問題,保障鏈上數據的真實性、準確性與一致性,但對於鏈下數據,區塊鏈則“鞭長莫及”,無法保證其質量。倘若鏈下源頭數據被“汙染”了,區塊鏈上流轉的數據就成了“垃圾”,也就是所謂的“垃圾進垃圾出”(“Garbage in, Garbage out”)。因此,高質量鏈下數據是高質量區塊鏈的前提。而要實現這個前提,則需要依靠各節點的鏈下數據治理。雖然說各節點的鏈下數據治理似乎是各家自己的事情,但某一節點的數據治理缺失往往會限制區塊鏈的整體質量和價值,形成短板效應。因此,各節點應採取有效的技術工具、管理手段和組織體系,對數據在計劃、獲取、存儲、共享、維護、應用、消亡全生命週期可能存在的質量問題,進行識別、度量、監控、預警和改進。

為了避免短板效應,可考慮成立聯盟鏈聯合工作組,評測各節點鏈下數據治理的成熟度,督促各方提高上鍊的數據質量,必要時可設置數據治理成熟度的准入門檻。目前已經有了比較成熟的數據治理評價模型可供採用,比如IBM的數據治理成熟度評估模型、CMMI的數據能力成熟度模型(DMM)、EDM的數據能力成熟度模型(DCAM)、DataFlux的數據治理成熟度模型、Oracle MDM主數據管理成熟度模型、MD3M主數據管理能力成熟度模型,以及我國信息技術標準化技術委員在2014年啟動並於2018年發佈的《數據管理能力成熟度評估模型》(Data Capability Maturity Model,簡稱DCMM)國家標準。

第二,參照主數據管理理論,開展鏈上數據治理

在數據治理框架中,主數據管理是核心。所謂的主數據是指描述機構核心業務實體的、在機構內外被廣泛應用和共享的數據,是機構的核心資產,具有高價值和高敏感性。構建統一的主數據標準,可將原先各個處於豎井之中的業務系統在主數據層面實現互通和共享,保障主數據的全局一致性和準確性。事實上,區塊鏈技術也可看作跨節點主數據的集成技術或架構。因此,我們可參照主數據管理理論,開展鏈上數據治理。

一是清晰的業務需求。不是所有的數據都要上鍊。只有需要多方共享的高價值數據,或者說只有主數據,才需要上鍊,早期甚至只有主數據的Hash指紋存證在鏈上。

二是明確的主數據規則和標準。聯盟鏈的各方應預先在標準和規則層面達成一致:是各節點的上鍊數據在鏈下統一標準,還是各自規範,僅在上鍊時通過數據抽取引擎(比如ETL、ESB),將異構數據轉為鏈上統一格式的標準數據集。如果是前者,那麼各方應共同制定鏈下數據標準,即統一的數據定義、分類、記錄格式和編碼,以及分類規範、編碼結構、數據模型、屬性描述。如果是後者,各節點在數據上鍊之前通過數據抽取引擎,對欲上鍊的數據進行一系列的加工處理,以形成標準統一的主數據,然後再根據鏈上數據操作規範要求進行數據存證與信息披露。

三是統一的鏈上元數據標準。為了使多源的鏈上數據能被區塊鏈各參與節點方準確理解和使用,需要事先對每個數據元素進行元數據定義,消除數據的二義性,降低數據集成的成本,讓各方能夠在統一的邏輯框架上解讀和驗證鏈上與鏈下數據。

四是適當的干預機制。歐盟《通用數據保護條例》(General Data Protection Regulation,簡稱GDPR)規定數據主體享有知情同意權、訪問權、拒絕權、可攜權、刪除權(被遺忘權)、更正權、持續控制權等多項權利。其中,刪除權(被遺忘權)是數據主體有權要求數據控制者立刻刪除與其有關的個人數據及其副本、備份和任何鏈接。更正權是指數據主體有權要求數據控制者更正並且完善與其有關的個人數據的權利。從這一角度看,區塊鏈的難以篡改與上述兩個數據主體權利存在一定的衝突。因此,需要在聯盟鏈上建立適當的干預機制,以滿足法律上的數據主體權利保護要求和其他合規要求,而且這也是保障良好網絡生態的應有之義。

五是科學的管理體系。數字治理本質上是一種管理活動,需要有相應的運維組織、管理流程和考核機制,推動數據標準規範的落地實施和有效執行。比如可考慮成立聯盟鏈聯合工作組,負責開展明確數據需求、制定標準、統一規則、監督評估等治理工作,並負責評測各節點的鏈下數據治理成熟度,行使節點的許可准入權力。

第三,加強數據安全管理與隱私保護,保障數據資產價值

隨著數字經濟時代的到來,數據已成為關鍵的生產要素。數據具有經濟價值,是重要資產。如何在數據共享的同時避免數據洩露,自然是數據治理的重中之重。在需求規劃時,各節點應預先梳理各自的數據,識別哪些是非密數據,哪些是保密數據,哪些是敏感數據,哪些是邊緣數據,哪些可公開,對誰可見,和誰共享,在此基礎上,根據數據的價值、敏感性和隱私性進行分級,制定訪問控制矩陣和差異化隱私策略。在數據上鍊時,應保證接口安全。無論鏈上數據訪問,還是鏈下數據訪問,應有身份認證、分級授權等訪問控制,防止攻擊者假冒合法用戶獲得訪問權限,保證系統和數據的安全。在數據的傳輸和共享過程中,可根據數據的共享和安全需要,對不同的數據進行脫敏,或者採用數據加密技術,比如零知識證明(ZKP)算法對數據加密,亦可採用一些通道技術來限制數據共享範圍,控制數據洩露風險。

結語

當前,區塊鏈技術已儼然成為一種不可阻擋的技術趨勢,是全球產業變革的全新賽道,各國均在發力,加速佈局。在這樣一個全球矚目的陣地,我們應紮實備戰,搶佔技術制高點。習總書記的講話是我國區塊鏈技術創新和產業發展的指導思想和根本遵循,我們應積極貫徹落實總書記重要講話精神,珍惜戰略機遇,求真務實,勇於探索,使區塊鏈技術在建設網絡強國、發展數字經濟、助力經濟社會發展等方面真正發揮作用。

本文僅代表個人學術觀點,不代表所在機構意見。文刊發於《清華金融評論》2020年1月刊,2020年1月5日出刊,編輯:王曄君


分享到:


相關文章: