讓假賬無所遁形的神奇數字定律——本福特定律

古歐洲時期的凱撒大帝為了安全地傳遞重要軍事情報,將情報加密之後形成密文,到達戰場之後,,由人員解密之後再執行下去。這個是個偉大的創造,後來人們知道,凱撒密碼的加密方式就是將明文按照字母表循環右移3位形成密文。比如

明文:MY LIFE IS COOL

密文:PB OLIH LV FRRO

讓假賬無所遁形的神奇數字定律——本福特定律

凱撒密碼加密原理

很明顯,這是個最基本的替換密碼,這套加密系統在相當長的時間內都是安全有效的。因為凱撒那個時代,會讀書寫字的太少,而且交戰雙方之間語言不通,任何一種在他們看起來毫無頭緒的情報內容都會被當做一種外族語言,作戰雙方也並沒有認識到情報傳遞在交戰時候的重大意義,所以這套簡單的加密系統可以使用數百年。

一直到公元9世紀,這套密碼系統被破解,因為人們發現了字母在使用過程中出現的頻率並不是一致的,而且在大範圍內統計之後,每個字母出現的概率都會穩定在某個值附近。這樣無論凱撒密碼的移位多少,總是會在這樣的頻率分析中無所遁形。對於字母頻率的分析也成了現代密碼分析學的一個基礎方法,很多加密方式的實現都是基於替換加密。

字母的出現頻率有規律,那麼我們使用的數字呢,當然也是會有的,1,2,3,4,5,6,7,8,9這些數字在一些場合的出現頻率並不是均等的,而是成規律分佈。比如以1開頭的數據出現的概率大概在30%左右,依次遞減,而以9開頭的數據則只有5%左右。有人在相當大範圍內統計,得出一個基本的分佈情況。為此還擬合出一條數學公式來表達這樣的頻率分佈。

讓假賬無所遁形的神奇數字定律——本福特定律

1881年,天文學家紐康伯發現對數表包含以1起首的數那首幾頁較其他頁破爛,其他頁數都比較新,他已經關注到了人們常使用的數據裡1開頭的要遠比別的數字開頭的要多得多。1938年,物理學家法蘭克·本福特重新發現這個現象,還通過了檢查許多數據來證實這點。本福特有趣考察了別的數據類型,比如人口出生率、死亡率、物理和化學常數、素數數字等各種現象進行統計分析後發現,由度量單位制獲得的數據都符合這一數字定律。本福特第一個深入研究了這個現象,所以這就叫本福特定律。

人們可以輕易地統計出這樣的規律來,卻很不清楚為什麼會有這樣的分佈。也只有很少一類數據人們可以從理論上解釋本福特定律。比如一個地區的人口數量。假設一個地區的人口從1萬人增加到2萬人,可能要10年的時間,但是從2萬人增加到3萬人可能就只要5年了,因為基數越來越大,所以增加的人數就越來越快,可能到最後從9萬人增加到10萬人只要1年就完成了。

讓假賬無所遁形的神奇數字定律——本福特定律

本福特定律在上市公司財務數據的應用

人們又去研究了更多的數據類型,發現了滿足本福特定律的數據必須是不能按照規律排列的,比如身份證號碼,發票編號,;同時數據也不能經過人工干預,如果經過人工干預的數據,就很難再符合本福特定律。因此這一條也成為鑑別賬目數據是否經過人工改造的有利工具,歷史上也有過很多次通過本福特定律查出數據造假。

審計學家依據這一定律發現了2004年美國總統選舉中佛羅里達州的投票欺詐行為,2004年委內瑞拉的投票欺詐和2006年墨西哥投票欺詐。2001年,美國最大的能源交易商安然公司宣佈破產,當時傳出了該公司高層管理人員涉嫌做假賬的傳聞。事後人們發現,安然公司在2001年到2002年所公佈的每股盈利數字就不符合本福特定律,這證明了安然的高層領導確實改動過這些數據。

讓假賬無所遁形的神奇數字定律——本福特定律

賬目審計中的本福特定律應用

對於一些完全隨機的數據信息,也不符合本福特定律,比如彩票開獎與撲克遊戲類。這也是人們也在大範圍的數據信息進行了統計分析得出的結果,事實上如果彩票開獎也符合本福特定律,那麼彩票機構就會虧得底朝天了。


分享到:


相關文章: