智能合約工程重要環節:形式化驗證方法

北京航空航天大學分佈式實驗室 北京航空航天大學雲南創新研究院 周楚涵 胡凱

形式化驗證(Formal Verification)是智能合約工程的重要環節,它可以成為對合約進行確定性驗證的一種技術,通過形式化語言把合約中的概念、判斷、推理轉化成智能合約模型,可以消除自然語言的歧義性、不通用性,進而採用形式化工具對智能合約建模、分析和驗證,進行一致性測試,最後自動生成驗證過的合約代碼,形成智能合約生產的可信全生命週期。

1. 形式化驗證

形式化驗證(Formal Verification)是基於形式化方法(Formal Method)相關理論。形式化方法起源於20世紀50年代對編譯技術的研究,20世紀60年代發生了“軟件危機”,當時針對“軟件危機”,主要有兩種解決方法:一種是採用合理有效的工程方法來管理和組織軟件的開發過程,這也是軟件工程的起源;另一種是建立嚴格的數學推導理論,以指導軟件開發過程,這方面推進了形式化方法的深入研究。

形式化方法主要包括形式規約和形式化驗證。形式規約是指應用具有精確語法和語義的形式化語言來刻畫系統的性質和行為,是設計系統約束和驗證系統是否正確的依據;形式化驗證是在形式規約的基礎上,建立系統的行為及其性質的關聯,進而驗證系統是否需求的關鍵性質。形式化驗證與形式化規約之間具有緊密的聯繫,形式化驗證就是驗證已有的程序(系統)P,是否滿足其規約(φ,ψ)的要求(即P(φ,ψ)),它也是形式化方法所要解決的核心問題。

目前常見的形式化驗證方法主要可分為兩類:演繹驗證和模型檢測。演繹驗證主要基於定理證明(Theorem Proving)的基本思想,採用邏輯公式描述系統及其性質,通過一些公理或推理規則來證明系統具有某些性質。目前主要的演繹驗證工具有:基於Manna-Pnueli證明系統的STeP(Stanford Theorem Prover)、TLV、機器定理證明器(ACL2、Coq、HOL、Isabelle、Larch、Nuprl、PVS、TPS)等。模型檢測(Model Checking)方法的基本思想是通過狀態空間搜索來確認合約是否具有某些性質。即給定一個合約(程序)P和規約ψ,生成對應於合約模型M,然後證明M╞ψ,即規約公式ψ在合約模型M中成立,這樣就證明了合約(程序)P滿足規約ψ。常用的模型驗證工具有:SMV(Symbolic Model Verifier)、SPIN(Simple Promela Interpreter)、SDL(Specification and Description Language)、UPPAAL等。

模型檢測技術是近三十年來最成功的自動驗證技術之一,目前被廣泛地應用於有限狀態系統的驗證,包括電路設計和通信協議的分析與驗證。根據所要驗證模型的規格特點,可以分為複合檢驗器、時態邏輯模型檢測器和行為一致檢驗器。根據採用的不同的技術可以分為:面向狀態的模型檢測和符號模型檢測。模型檢測器的基本原理都是一樣的,其工作原理如圖1 所示。通常情況下,模型都需要經過迭代驗證的過程,才能最終滿足驗證條件。


智能合約系列 | 智能合約工程重要環節:形式化驗證方法

圖1 模型檢測器原理

形式化驗證是一種基於數學和邏輯學的方法,在智能合約部署之前,對其代碼和文檔進行形式化建模,然後通過數學的手段對代碼的安全性和功能正確性進行嚴格的證明,可有效檢測出智能合約是否存在安全漏洞和邏輯漏洞。該方法可以有效彌補傳統的靠人工經驗查找代碼邏輯漏洞的缺陷。形式化驗證技術的優勢在於,用傳統的測試等手段無法窮舉所有可能輸入,而我們用數學證明的角度,就能克服這一問題,提供更加完備的安全審計。


2. 形式化驗證在區塊鏈領域的應用現狀

隨著區塊鏈平臺級應用的普遍化,智能合約涉及的金額呈指數級別增長,智能合約的安全問題也成為投資者和開發者共同關注的焦點。今年以來有數個基於ERC-20的項目因為智能合約代碼出現漏洞而遭到黑客攻擊,導致投資者鉅額的損失。為了防止類似事件的發生,交易所、錢包、項目方等都在智能合約安全上加大投入,同時圍繞著智能合約安全的周邊生態成為目前投資的熱點。

形式化驗證技術已經在軍工、航天等高系統安全要求領域的取得了相當成功的應用,將形式化方法應用於智能合約,使得合約的生成和執行有了規範性約束,保證了合約的可信性,使人們可以信任智能合約的生產過程和執行效力。通過形式化語言,把合約中的概念、判斷、推理轉化成智能合約模型,可以消除自然語言的歧義性、不通用性,進而採用形式化工具對智能合約建模、分析和驗證,進行一致性測試。合約的形式化驗證保證了合約的正確屬性,自動化代碼生成提高了合約的生成效率,合約的一致性測試保證了合約代碼與合約文本的一致性。

目前區塊鏈產業中與形式化驗證相關的產品可以分為三類: VaaS平臺,公鏈,和語言,應用尚在技術的早期,自動化程度和實用性,及用戶工具還有待於極大的進步。


智能合約系列 | 智能合約工程重要環節:形式化驗證方法

(1)Vaas平臺


是直接面向開發者提供形式化驗證服務的平臺。目前Vaas類項目包括 CertiKzecurify.ch、Runtime Verification 等項目。目前,CertiK仍在初始階段,Securify.ch 的測試版已經上線,而 Runtime Verification 已經在商業運營。

與其它幾個項目不同,Runtime Verification是基於EVM虛擬機二進制碼進行形式化驗證,而非針對智能合約本身用的高級語言,因此在安全性上又更進一步,避免了因編譯器編譯過程中可能產生的漏洞。

(2)語言

語言類產品一般為函數式語言的子語言,提供與智能合約形式化驗證相關的開發者庫和工具,目前有Imandra和Tezos等項目。

其中,Imandra發佈了一套開源的以太坊虛擬機用ImandraML語言標記的模型,並且專注於交易所等金融應用場景的形式化驗證,用以確保金融交易的合法合規,據稱相關技術已經用於華爾街頂級投行的交易系統。

(3)公鏈

直接包含形式化驗證引擎的公鏈產品目前只有 The Matrix 項目,特徵是基於 AI 輔助的形式化驗證及動態約束的檢查。AI 是否對於形式化驗證的自動化帶來幫助在技術上仍是個未知數。

3. 智能合約的形式化驗證

智能合約的安全性驗證問題迫在眉睫,智能合約可能存在的主要安全隱患有:1)合約中某一方利用合約漏洞修改合約,使得合約執行結果偏向某一方;2)智能合約攻擊者利用合約漏洞攻擊合約,造成合約中財產的損失。這最終都會導致人們對於智能合約的不信任。在智能合約的驗證方面,形式化驗證方法可以檢查智能合約的很多屬性,例如,合約的公平性、可達性、有界性、活鎖、死鎖、不可達,以及無狀態二義性等。形式化方法重點可以解決智能合約產生與執行的可信性問題。採用模型檢測的優點是完全自動化並且驗證速度快,即便是隻給出了部分描述的合約,通過搜索也可以提供關於已知部分正確性的有用信息。尤其重要的是,在性質未被滿足時,搜索終止可以給出反例,這種信息常常反映了合約設計中的細微失誤,因而對於合約排錯有極大的幫助。

這裡我們採用模型檢測工具SPIN對智能合約進行驗證。SPIN是用來檢測和驗證分佈式軟件系統的模型檢測器。SPIN(Simple Promela Interpreter)即PROMELA解析器,是由美國貝爾(Bell)實驗室開發並用於形式化驗證分佈式軟件系統的模型檢測器,是一種廣泛應用於大規模複雜軟件系統的形式化模型檢測器,與商業性模型檢測器相比,SPIN在技術上和使用上更加自由和開放。

描述一個智能合約,包括以下幾個方面:合約方的信息(身份、權限等)、合約狀態機(合約背景、合約狀態集合、狀態轉換函數、合約輸入、合約輸出、合約的初始狀態和合約的終止狀態)、各個合約方的執行狀態機。


智能合約系列 | 智能合約工程重要環節:形式化驗證方法


智能合約系列 | 智能合約工程重要環節:形式化驗證方法

COutput是合約輸出的集合,COutput={ COData},COData為合約輸出的數據。智能合約規定可以部分執行完成,因此,合約的輸出可能是合約執行中間的一個結果輸出,也可能是合約全部執行完成。合約的輸出統一使用數據類型表示,每一個輸出都意味著合約狀態的遷移,同時每一次合約輸出都分別對應了一個合約狀態。

CFunction是合約狀態轉換函數的集合,且有CFunction:MStatusMStatus。

CInit為合約初始狀態值,且。

CFinal為合約終止狀態的集合,CFinal={,,,},且。

CBackground為智能合約其他相關信息的描述。

在智能合約的描述過程中,合約的狀態變遷過程代表了合約的執行過程,合約模型採用PROMELA進行合約建模。

SPIN的驗證過程,首先從描述系統模型的規格開始,經過編譯器的分析確定沒有語法錯誤後,對系統模型進程之間的交互進行模擬,直至確認系統模型中出現的行為和系統設計的預期行為一致。其次,SPIN從系統的高級規約中會生成一個優化後的on-the-fly驗證程序,經過編譯器編譯後執行,執行中會檢測是否有違背正確性說明,若有反例出現,則返回交互模擬的執行狀態進行再修正,確認出錯原因,直至完成正確性驗證。其驗證框架如圖 2所示


智能合約系列 | 智能合約工程重要環節:形式化驗證方法

圖 2 基於SPIN驗證框架

據此驗證框架,我們設計完成了一個形式化驗證系統,取得了較好的驗證效果, 值得推廣應用,後文將給出一個驗證案例。


分享到:


相關文章: