本福特定律
维库,知识与思想的自由文库
本福特定律說明一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的機率就越低。它可用於檢查各種數據是否有造假。
在十進制首位數字的出現機率(%,小數點後一個位):
- 30.1
- 17.6
- 12.5
- 9.7
- 7.9
- 6.7
- 5.8
- 5.1
- 4.6
目录 |
[编辑] 數學
本福特定律說明在b進位制中,以數n起頭的數出現的機率為logb(n + 1) − logb(n)。本福特定律不但適用於個位數字,連多位的數也可用。
[编辑] 不完整的解釋
一組平均增長的數據開始時,增長得較慢,由最初的數a增長到另一個數字a + 1起首的數的時間,必然比a + 1起首的數增長到a + 2,需要更多時間,所以出現率就更高了。
從數數目來說,順序從1開始數,1,2,3,...,9,從這點終結的話,所有數起首的機會似乎相同,但9之後的兩位數10至19,以1起首的數又大大拋離了其他數了。而下一堆9起首的數出現之前,必然會經過一堆以2,3,4,...,8起首的數。若果這樣數法有個終結點,以1起首的數的出現率一般都比9大。
這個定律的嚴格證明,可以參見Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.。
[编辑] 應用
1972年,Hal Varian提出這個定律來用作檢查支持某些公共計劃的經濟數據有否欺瞞之處。1992年Mark J. Nigrini便在其博士論文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它檢查是否有偽帳。
推而廣之,它能用於在會計、金融甚至選舉中出現的數據。
若所用的數據有指定數值範圍;或不是以機率分布出現的數據,如常態分佈的數據;這個定律則不準確。
[编辑] 歷史
1881年,天文學家西蒙·紐康伯發現對數表包含以1起首的數那首幾頁較其他頁破爛。可是,亦可以以任何書起首數頁也會較破爛這個觀點解釋。這個故事可能是虛構的。
1938年,物理學家法蘭克·本福特重新發現這個現象,還通過了檢查許多數據來證實這點。
[编辑] 另見
[编辑] 參考
- 2005年6月2日明報D15版,《假帳剋星——本福特定律》,吳端偉博士[1]
- 部分翻譯自本頁英文版,以下為其參考:
- Frank Benford: The law of anomalous numbers, Proceedings of the American Philosophical Society, 78 (1938), p. 551
- Ted Hill: The first digit phenomenon, American Scientist 86 (July-August 1998), p. 358. 10頁的pdf文件
- Hal Varian: Benford's law, American Statistician 26, p.65.




