人生就是概率和機遇。

——劉慈欣

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

昨天,坤鵬論談到了上市公司造假的問題,難道就沒有辦法識破嗎?

正是這樣的疑問使我想起了概率論中一些辨偽招數,今天就來聊聊它們。

當然,即使掌握了這些方法,也不能讓你輕松破解財務造假,畢竟道高一尺,魔高一丈,這樣的博弈一直在不斷升級。

一、統計學教授用概率破解造假

大多數人都不了解概率在日常生活中的重要性,美國有位教授曾用下面的方式,向他的學生證實這一點。

他每年教統計學時,都會要求班上的每個學生假裝隨便扔20次硬幣,并把想象的結果寫在一張紙上,并用X和O分別代表硬幣的正面和反面。

但是,他會指定一名學生必須真的扔硬幣,而且照實記下結果。

學生在做這項功課時,教授會暫時離開教室,等到學生們都完成后,他再回來。

他面對的挑戰是,從許多記錄紙張中挑出真正扔硬幣的結果。

令學生們總是不可思議的是,他每次都指認無誤,從來沒有一次失手。

他是怎么做到的呢?

這是因為真正扔硬幣的結果,幾乎都會包含有最長的連續正面或反面組合,比如:OXXXXXOXOOXOOXOOXOOX,而想像的結果通常是這個樣子的:XXOXOOOXOOXOXXOOXXOO。

這是因為我們普通人都會低估連續丟出好幾個正面或反面的可能,所以才不會寫出一長串相同的組合。

盡管根據概率的特點,如果長時間的話,出現正面和反面的次數會相同,但也有老是丟出正面或反面的時候。

根據專家的不懈實驗,丟硬幣有如下學問:

1.任何一次丟硬幣,出現正面或反面的幾率都是50%,也就是1/2。

2.但是如果連續丟20次硬幣,在這個過程的任何時候,連續出現3次正面或反面的可能性,高達80%,連續出現4次正面或反面的可能性為50%,連續出現5次正面或反面的可能性是25%。

3.在這個過程的任何時候,不論已經連續出現幾次正面,下一次再丟出正面的可能性還是50%。

短期來說,股市也是一種概率,假設一只股票,第一天跌了,第二天跌了,第三天跌了,第四天跌了,越往后,其跌的概率越低,那就意味著,概率本身就和企業的價值無關。

用概率去炒股,它是非常準確的,如果你能建立一個數學模型,用概率去計算,那個股價應該是最標準的,只是找到合理的模型很難很難。

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

二、沒有可疑才是大大的可疑

某餐館老板做了假賬,編篡了每個星期的營業額。

但其賬簿在內行人眼里,錯得非常明顯:n多數據末尾中沒有一個以00為結尾。

這是因為偽造數據者往往認為整數不夠隨機。

但是,在真實的世界中,從00到99,每組兩位數的出現概率約為1%。

這同樣也是統計學的概率,大多數人不懂,自然也就編不出正常的數據,人們在偽造數據時常會犯的錯還包括:

多次使用個人偏愛的數字,因為每個人都有自己偏愛的數字,造假時往往真情流露,經常使用它;

有意識地避免整齊的數字,或者連續的數字,認為它們“不夠隨機”,不夠真實;

當人們要偽造表面合理的數據時,他們一般會用以5或6為第一個數的數據;

如果數據有上限,比如報銷金額是500,可能會多次采用478、485這類靠近的數字......

當人們在數據上造假時,必須捏造一系列看似正常,沒有可疑之處的隨機數字,而偏偏就是這樣的“沒有可疑”,事實上才是大大的可疑。

三、本福特定律

話說美國有位傳奇天文學家叫西蒙·紐康(1835年3月12日~1909年7月11日),被《大英百科全書》譽為“那個時代最顯赫的天文學家之一。”

他曾寫了一本名為《通俗天文學》的書,從1923年至今,重印上千次,全球銷售過億。

紐康在查閱對數表時發現了一個奇怪的現象,包含以1開頭的數的那幾頁比其他頁破爛得多,似乎表明計算所用的數值中,首位數是1的概率更高。

1881年他發表了一篇文章提到并分析了這個現象,但沒有引起人們的注意。

直到57年之后的1938年,美國有位電氣工程師再次發現了這個現象。

此人叫弗蘭克·本福特,也有說他是物理學家,反正和統計學、概率論沒有半點關系,但人到中年時卻迷上了一個與概率有關的課題,課題得到的結論就是現在要說的“本福特定律”。

這個定律說,在眾多真實數據中,以“1”為首位數字的數出現的概率約占總數的三成,也就是30%左右。

比如:隨機抽取銀行1000多個儲蓄賬戶,存款金額不等,請問,這些存款數額中第一位是1的概率有多少?

我們知道,存款金額隨機的話,那么第一位從1到9都有可能,正常人的答案肯定是1/9。

但是,本福特通過不斷驗證后卻告訴我們,數字越大,出現在第一位的概率就越小。

首位數字為1的概率能達到30%,以2開頭占18%,以3開頭的情況約為12.5%,而數字9出現在第一位的概率只有4.5%左右。

在發現這個規律后,本福特興奮不已,馬不停蹄地收集并研究了20229個統計數據,包括河流面積、人口統計、分子及原子重量、物理常數等多種來源的資料,并分成20組。

雖然數據來源千差萬別,卻基本符合本福特之前發現的規律。

本福特的發現實至名歸地成為了定律。

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

本福特定律適用范圍非常廣泛,自然界和日常生活中獲得的大多數數據都符合這個規律。

比如:統計一下世界上237個國家的人口數量,以1開頭的數驚人地占到了27%,而以9開頭的數卻只占5%。

不過,這個定律也有以下限制:

數據必須跨度足夠大,樣本數量足夠多,數值大小相差幾個數量級;

人為規則的數據不滿足本福特定律,例如按照某種人為規則設計選定的電話號碼、身份證號碼、發票編號等。

為造假而人工修改過的實驗數據、彩票上的隨機數據也不符合本福特定律。

雖然,紐康和本福特都總結出了首位數字的對數規律,但并未給出證明,直到1996年佐治亞理工學院的數學家泰德·希爾依據本福特定律確定哪種情況產生這種數字,并進行了嚴謹的數學證明。

他還指出,當我們擁有分布中的分布,也就是對隨機抽樣的隨機采集時,這樣的數字集就會出現,龐大、混雜的數字集也遵循本福特定律。

上世紀70年代初,谷歌首席經濟學家的哈爾·瓦里安曾表示,如果經濟數據在進入一種經濟模型時符合本福特定律,但從這種經濟模型出來時不符合本福特定律,那就應該再研究一下這個模型。

圣·路易斯華盛頓大學經濟學家約翰·奈和查爾斯·莫曾利用本福特定律,考察了一些基本的宏觀數據。

他們發現,經合組織(OECD)的數據非常符合本福特法則。

這表明,GDP數據應符合本福特法則,但非洲的GDP數據則與之不符。

當然,我們無法肯定,這些不符緣于弄虛作假或統計部門資金不足,但這提醒我們,某些數據應伴隨健康警示。

再后來,美國一個有數學天賦的會計師——馬克·尼格里尼,在上世紀90年代名揚天下,原因是他利用本福特定律,發現了會計造假、欺詐和逃稅行為,比如:偽造一些小額發票,金額略低于需要管理層批準的門檻。

尼格里尼根據本福特定律發展出一套方法用來檢驗帳目的真實性,如果有人對帳目做過手腳,利用他的方法可以發現疑點,該方法被成為“尼格里尼求和法”。

后來,“尼格里尼求和法”被執法機構、稅務機構和私營部門廣泛采納。

審計人員可以利用這一點來判斷數據是真實可信的還是偽造出來的。

1998年,據《紐約時報》報道,包括加利福尼亞州在內,美國好幾個州的稅務機構都使用以本福特定律為基礎的檢測軟件。

美國華盛頓州曾利用本福特定律偵破了當時最大的投資詐騙案,涉案金額高達1億美元。

詐騙主謀凱文·勞倫斯和其同伙以創辦高科技含量的連鎖健身俱樂部為名,向5000多個投資者籌集了大量資金。

但是,所謂的健身俱樂部根本就是子無虛有,資金被他們用來吃喝玩樂。

為了欺騙投資者,他們還把資金在海外公司和銀行間頻繁轉賬,并做假賬,給人一種生意興隆的錯覺。

后來,有位名為達雷爾·多雷爾的會計師覺得不大對頭,于是便將70000多個與支票和匯款有關的數據收集起來,將這些數據首位數字發生的概率與本福特定律相比較,發現根本無法通過本福特定律的檢驗。

最后經過了3年的司法調查,終于拆穿了這個投資騙局,2002年,勞倫斯被判入獄20年。

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

當年,美國著名的安然造假案中,其2001年到2002年所公布的每股盈利數字就不符合本福特定律,這證明了安然的高層領導確實有改動過這些數據。

國內有人曾用上證50的公司與5家有舞弊行為的公司的季度財務數據進行了對比,發現上證50的公司符合本福特定律的季度數,不管在最近一年、兩年、三年、四年,而那5家造假公司的數據則與本福特定律存在出入。

還有人選取了滬深兩市2000年~2010年2087家上市公司的年度、季度財報進行研究。

測試結果顯示,總體上,滬深兩市的主要財務數據首位數的分布,表現出了本福特定律所描述的規律,但是,其中營業成本和本福特定律的理論值有較好的一致性,資本公積和所有者權益合計與本福特定律的符合度較差。

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

從資產負債表可以看出:

2000年~2002年的相關系數都比較低,而這三年恰恰是中國上市公司報表披露的混亂時期,大型報表舞弊案在這三年出現多起,例如:銀廣夏案等。說明這段時間上市公司的報表舞弊情況普遍比較嚴重。

2003年~2007年相關系統突然回升,兼有逐年降低的趨勢。在2003年和2004年,審計署對報表舞弊嚴重的銀廣夏、西安達爾曼、天津磁卡、藍田股份、大慶聯誼做出公開處罰,糾正了當時粉飾報表的不正之風。所以,2003年和2004年的相關系統突然升高,與當時審計署的工作分不開。

同時,這段時期實行了新會計準則,很多企業利用會計準則進行舞弊,比如:在效益好的年份將部分利潤隱藏在壞賬準備里,并在業績不好的年份將其提出以粉飾利潤。

另外,2007年1月1日后,中國再次實行新會計準則,使得很多在之前會計準則中可以使用的舞弊手段不能再用,因此2007年集中了大量非正常與正常調整,造成當年相關系數成為這段時期低谷的情況。

2008年~2010年,這個階段又表現出一個回升之后逐年降低的趨勢。2008年是中國實行新會計準則的第二年,大部分調整已集中體現在了2007年,因此當年相關系數相對2007年來說出現顯著回升。

而2008年遭遇全球金融危機,一直波及到了2009年和2010年,造成企業普遍出現效益不好的情況,企業可能會出于對融資、股價等方面的考慮,對財務數據進行了人為操縱,使得相關系數逐年降低。

坤鵬論:上市公司造假 統計學告訴你怎么破!-自媒體|坤鵬論

而利潤表的表現和資產負債表不同:

整體財務數據和本福特定律理論值的相關系數普遍很高,絕大部分都在0.999以上,說明公司普遍對利潤表(營業收入、營業成本、利潤總額、凈利潤)進行的數據操縱行為較少。

因此,整體上看,從2000年到2010年,中國上市公司的利潤表相比較資產負債表,的確受相關公司人為操縱的因素較少。

本文由“坤鵬論”原創,轉載請保留本信息

坤鵬論

請您關注坤鵬論微信公眾號:kunpenglun。坤鵬論自2016年初成立至今,創始人為:封立鵬、滕大鵬、江禮坤,是包括今日頭條、雪球、搜狐、網易、新浪等多家著名網站或自媒體平臺的特約專家或特約專欄作者,目前已累計發表原創文章與問答6000余篇,文章傳播被轉載量超過800余萬次,文章總閱讀量近20億。


注:坤鵬論由三位互聯網和媒體老兵封立鵬、滕大鵬、江禮坤組合而成。坤鵬論又多了位新成員:廖煒。即日起,坤鵬論所有自媒體渠道對外開放,接受網友投稿!如果你的文章是寫科技、互聯網、社會化營銷等,歡迎投稿給坤鵬論。優秀文章坤鵬論將在今日頭條、微信公眾號、搜狐自媒體、官網等多個渠道發布,注明作者,提高你的知名度。更多好處請關注微信公眾號:“坤鵬論”微信公眾號:kunpenglun,回復“投稿”查看,自媒體人可加QQ群交流,群號:6946827