一、統(tǒng)計檢驗與實證會計研究方法之關(guān)系
有比較才能有鑒別。為認清實證會計研究方法的特點,我們不妨先把它和傳統(tǒng)的規(guī)范會計作一考察對比。
規(guī)范會計學是一套關(guān)于“應(yīng)該是什么”的系統(tǒng)知識體系,它以若干會計假定為起點(根據(jù)我國《
企業(yè)會計準則》,會計假定包括會計主體假定、持續(xù)經(jīng)營假定、會計分期假定以及貨幣計量假定),通過提出一系列基本的會計原則、會計準則的規(guī)范要求,從邏輯高度上概括或指明最優(yōu)化的
會計實務(wù)是什么,進而指導實務(wù),規(guī)范實務(wù)。實證會計理論是一套關(guān)于會計“是什么”的系統(tǒng)知識體系,目的在于揭示會計現(xiàn)象的內(nèi)在規(guī)律性,從而為解釋現(xiàn)行會計實務(wù)和預(yù)測未來會計實務(wù)提供理論依據(jù)。
規(guī)范會計研究的這種作法自有其道理。因為對現(xiàn)實進行抽象是一切科學研究的起點。具體的會計實務(wù)成千上萬,它們雖能幫助我們增加對會計的親切感,但如果不作抽象,系統(tǒng)的會計知識就不可能形成。概念的抽象能夠彌補行知的不足。這可以視為一個普遍的規(guī)律。
實證會計研究的核心是:根據(jù)經(jīng)濟學等有關(guān)理論,設(shè)立各種有關(guān)影響會計事務(wù)因素的假設(shè),然后采用一定的科學方法,進行實際的調(diào)查研究,以證明這些假設(shè)的現(xiàn)實性。
由此可見,實證會計研究中所說的假設(shè)(Hypothesis)與規(guī)范會計研究中所說的假定(Assumption)是完全不同的概念。規(guī)范研究中所說的假定,是對所研究問題設(shè)定的基礎(chǔ)條件,亦即研究之前根據(jù)人們的某種共識或前人的權(quán)威論斷,研究者對問題存在的主客觀環(huán)境作出一些限制性約定,如經(jīng)濟行為遵循的規(guī)則、價值判斷的依據(jù)、特定的歷史、經(jīng)濟、文化環(huán)境以及行為主體的基本特質(zhì)等等。作出這些約定,是為了使規(guī)范研究的問題環(huán)境得以簡化,邏輯推理有公認的起點與規(guī)則。因此規(guī)范研究中所說的假定在該研究過程中是不可能改變的。不同的規(guī)范研究者對同一個問題可以建立不同的假定,這樣就可以導致不同的結(jié)論。規(guī)范研究的理論發(fā)展通常是通過對以前研究的前提假定作出修改或擴展而實現(xiàn)的。
而實證研究中所說的假設(shè),是對所研究問題的結(jié)果或狀態(tài)的一種預(yù)期,需要通過假設(shè)檢驗,用證據(jù)判斷其真?zhèn)。也就是說,經(jīng)過實證研究,開始時提出的假設(shè),最終可能因得到實際資料的支持而被認可,也可能,由于實際資料不支持而被拒絕。若一個假設(shè)可以用統(tǒng)計方法加以檢驗的話,則這種假設(shè)就可視為能夠檢驗的,也就是“可證偽的”,當然,并非它一定會被證偽。
建立可證偽的假設(shè)就是建立可檢驗的假設(shè)。之所以稱之為“可證偽的”假設(shè),是因為假設(shè)檢驗統(tǒng)計方法的基本思路是利用樣本所提供的信息去論證是否可以據(jù)此推翻原假設(shè)。實證會計研究方法盡管有多種多樣,既有傳統(tǒng)的統(tǒng)計描述、回歸相關(guān)分析,也有比較高級的統(tǒng)計分析方法如方差分析、聚類分析、判別分析、因子分析、多元統(tǒng)計分析、條件概率、貝葉斯方法、定性資料的統(tǒng)計分析方法,等等,但使用這些方法的目的只有一個,那就是利用數(shù)據(jù)檢驗假設(shè),解釋結(jié)果并得出結(jié)論。因此,統(tǒng)計檢驗是實證會計研究方法的核心。
二、統(tǒng)計檢驗在實證會計一般實證過程中的體現(xiàn)
如上所述,抓住假設(shè)檢驗在實證會計中的應(yīng)用,就意味著抓住了實證會計方法的關(guān)鍵。統(tǒng)計檢驗在實證會計的一般實證過程中的核心作用可通過以下四個步驟來體現(xiàn)。
第一步:提出原假設(shè)和備擇假設(shè)
這是對研究人員處理問題能力的一種鍛煉,關(guān)鍵在于要把握住具體問題的會計學與經(jīng)濟學涵義。正確區(qū)分原假設(shè)和備擇假設(shè)是實證會計研究取得成功的前提。原假設(shè)通常用H[,0]表示,而備擇假設(shè)用H[,1],或H[,a]表示。H[,0]指觀察到的差異只反映機會變異,而H[,1]或H[,a]指觀察到的差異是真實的。
第二步:選取作假設(shè)檢驗用的統(tǒng)計量
這也是一種能力鍛煉,它注重的是研究人員運用數(shù)理統(tǒng)計工具的能力。這一步和下一步,從統(tǒng)計學上看難度較大。好在當我們利用常用的統(tǒng)計量作推斷時均有數(shù)表可查。
為使統(tǒng)計量T發(fā)揮作用,它必須具備下列兩個重要性質(zhì):一是當H[,1]成立時,T(X[,1],X[,2]……,X[,n])的表現(xiàn)應(yīng)與當H[,0]成立時的表現(xiàn)有所不同,因為T(X[,1],X[,2],……,X[,n])是用來表明推翻H[,0]的證據(jù)之強弱的,并且一般地,實際情況和H[,0]的假定差別越大,T(X[,1],X[,2],……,X[,n])的表現(xiàn)也就該越不相同;二是在假定H[,0]成立的條件下,T(X[,1],X[,2],……,X[,n])的概率分布必須能夠計算出來(至少能近似地算出)。這個概率分布稱為零分布,它提供了一個基準,據(jù)此判斷在假設(shè)H[,0]下,我們所觀察到的樣本數(shù)據(jù)相對于H[,0]而言合理或不合理的程度,可用以評價所得到的推翻H[,0]的證據(jù)的顯著(強弱)程度。
第三步:臨界區(qū)域的構(gòu)造及其利用
統(tǒng)計量T(X[,1],X[,2],……,X[,n])選定之后,可以設(shè)問:“統(tǒng)計量的什么樣的樣本觀察值能夠表明我們得到了推翻H[,0]的證據(jù)?那種能表明H[,0]不成立的統(tǒng)計量觀察值的全體,就被稱為臨界區(qū)域。因此,若發(fā)現(xiàn)由數(shù)據(jù)算出的T(X[,1],X[,2],……,X[,n])值位于臨界區(qū)域內(nèi),我們就拒絕H[,0]而支持H[,1].此事一經(jīng)發(fā)生,就可以說得到了足以拒絕H[,0]的顯著證據(jù),或者說,T(X[,1],X[,2],……,X[,n])的值是顯著的;但若T(X[,1],X[,2],……,X[,n])不在臨界區(qū)域內(nèi),就表示沒有足夠的證據(jù)拒絕H[,0]而支持H[,1],這時就可以說T(X[,1],X[,2],……,X[,n])值是不顯著的。
第四步:顯著性水平的確定及臨界值的決定
如果確認T≥c為臨界區(qū)域合適的模型(自然可以討論T>c、T≤c及T<c的情形),c值該如何選?遺憾的是,無論在現(xiàn)實中怎樣確定拒絕或不拒絕H[,0]的標準,總有可能作出錯誤的結(jié)論。
例如,若臨界區(qū)域相對說來很大,則H[,0]有可能遭拒絕而事實上不該拒絕。另一方面,若把臨界區(qū)域做得很小,則在應(yīng)該拒絕H[,0]時反而沒有拒絕它。在實踐中,H[,0]的拒絕與否取決于檢驗的顯著性水平。所謂顯著性水平,即當客觀上H[,0]成立而被判不成立時,我們所需承擔的風險(此即“第1類錯誤”,通常用α表示)。可見顯著性水平就是當H[,0]成立時獲得有顯著意義的拒絕H[,0]的T(X[,1],X[,2],……,X[,n])值的概率。顯著性水平越高,臨界區(qū)域就越大;顯著性水平越低,臨界區(qū)域就越小。
在實證會計研究中,經(jīng)常采用的顯著性水平為1%,5%,10%(注:在實踐中,實證會計研究人員常使用P[-]值(即觀察到的顯著性水平)。使用P[-]值的好處是,一般地說,在單側(cè)檢驗時,不明確的先驗信息所導出后驗概率與P[-]值近似,而經(jīng)典的犯第Ⅰ類錯誤及第Ⅱ類錯誤的概率通常都不與相應(yīng)的后驗概率近似。)。
完成上述四個步驟之后,我們就可以作出關(guān)于H[,0]的結(jié)論了。首先,現(xiàn)實顯著性與統(tǒng)計顯著性是有差別的:現(xiàn)實顯著性著重在所觀察到的差異有無實際上的重要性,而統(tǒng)計顯著性則著重所觀察到的差異可否僅用隨即性去解釋;其次,統(tǒng)計上的顯著性不必有現(xiàn)實意義,但是,若現(xiàn)實的顯著性達不到統(tǒng)計顯著性,則不能充分使人信服,因其不能排除偶然因素的作用;最后,在實證會計研究中,這種對統(tǒng)計問題的解釋是需要謹慎對待的。
三、使用簡單假設(shè)檢驗應(yīng)注意的問題
筆者認為,使用簡單原假設(shè)檢驗應(yīng)注意以下幾個問題。
首先,在概率論中,兩個隨機變量X,Y之間的相關(guān)程度常用相關(guān)系數(shù)ρ表示,它實際是線性相關(guān)性,且須假定X,Y均來自正態(tài)總體。因而,H[,0]:ρ=0,H[,1]:ρ≠0這種形式的檢驗就很常見。(無論是原假設(shè)還是備擇假設(shè),若原假設(shè)假定我們所關(guān)心的參數(shù)取單一數(shù)值,則稱為簡單原假設(shè),否則就稱為復合原假設(shè))若H[,0]成立,則X,Y之間不存在相關(guān)關(guān)系,一般說來,我們也就不必關(guān)心它們了。
其次,對容易量化與不容易量化者要有所選擇。在實證會計文獻中,這種形式的簡單原假設(shè)檢驗也很普遍,但形式上有變化。人們更常用回歸方程能否通過統(tǒng)計檢驗的方式,來考慮兩個隨機變量是否有相關(guān)關(guān)系(甚至是因果關(guān)系)。
比起直接考察H[,0]:ρ=0,H[,1]:ρ≠0,用回歸方程研究兩變量之間的關(guān)系,雖然計算上復雜一些,但問題的性質(zhì)并無改變:都是利用統(tǒng)計檢驗對簡單假設(shè)作出取舍決定。當然,使用回歸方程的形式自有其原因。
這種用回歸方程考察兩個隨機變量是否相關(guān)的簡單原假設(shè)檢驗,應(yīng)引起我們的重視,因為,這涉及與經(jīng)典答案完全不同的貝葉斯解釋(可惜許多實證會計文獻對此關(guān)注不夠)。
筆者發(fā)現(xiàn),實證會計問題所涉及的隨機變量,往往是一個容易量化而另一個則不容易量化,須經(jīng)人為地“變量分解”才行。比如,美國學者Mark H.Lang & Russell J.Lundholm在其“公司信息披露政策與
財務(wù)分析師行為”一文中(注:Corporate Disclosure Policy and Analyst Behavior,by Mark H.Lang & Russell J.Lundholm,The Accounting Review,Vol.71.No.4,Oct1996.),就試圖考察“財務(wù)分析師人數(shù)”與“對某公司信息披露政策有了解”這兩個隨機變量之間是否存在關(guān)系。如果這兩個隨機變量都容易量化,則取一樣本(Xi,Yi),i=1,2……n,計算簡單相關(guān)系數(shù)r并對其作相應(yīng)的t[-]檢驗或F[-]檢驗,即可作出判斷。
在這個問題中,不好量化的顯然是“對某公司信息披露政策有了解”。Mark H.Lang & Russell J.Lundholm的做法是,設(shè)計7個可計量的(解釋)變量來近似表示“對某公司信息披露政策有了解”,從而建立“財務(wù)分析師人數(shù)”關(guān)于這7個解釋變量的回歸方程(注:Number of Anakysts=α+β[,1] Annual Report+β[,2] Other Publications+β[,3] Investor Relations+β[,4] Total Score+β[,5] Market Value+β[,6] Standard Deviation of ROE+β[,7] Return-Earnings Correlation+ε。),經(jīng)過抽取樣本,對數(shù)據(jù)作分析,兩位作者得出“財務(wù)分析師人數(shù)”與“對某公司信息披露政策有了解”兩變量之間有密切關(guān)系的結(jié)論。
兩個隨機變量,一個容易量化,一個不容易量化,選擇若干容易計量的變量代替不容易量化的變量,建立回歸方程,以研究所關(guān)心的兩個隨機現(xiàn)象之間的相關(guān)關(guān)系,這種例子俯拾皆是。這既是當代統(tǒng)計學的發(fā)展趨勢,也是實證會計研究的特點所在,可以認為是一個規(guī)律。我們認為研究水平的高低往往取決于回歸自變量的選擇是否適當。
H[,0]的后驗概率
z(P[-]值) n
1 5 10 20 50 100 1000
1.645(0.1) 0.42 0.44 0.49 0.56 0.65 0.72 0.89
1.960(0.05) 0.35 0.33 0.37 0.42 0.52 0.60 0.80
2.576(0.01) 0.21 0.13 0.14 0.16 0.22 0.27 0.53
3.291(0.001) 0.086 0.026 0.024 0.026 0.034 0.045 0.124
。ū颈礓涀浴敖y(tǒng)計決策論及貝葉斯分析”,第166頁,[美]James O.Berger著,賈乃光譯,吳喜之校譯,中國統(tǒng)計出版社1998)
第三,進一步思考貝葉斯推斷的特點。進行形如H[,0]:ρ=0,H[,1]:ρ≠0的原假設(shè)為簡單假設(shè)的檢驗,通常是不適當?shù)。事實上,完全接受絲毫不差的ρ=0的可能性不存在。更合理的原假設(shè)應(yīng)該是ρ∈Θ0=(0-b,0+b),其中b>0為某一常數(shù),選擇b使ρ∈Θ0與ρ=0“難以區(qū)別”。
當確知應(yīng)做檢驗H[,0]:ρ∈Θ0=(0-b,0+b)時,需要知道何時以H[,0]:ρ=0作為近似是適宜的。按貝葉斯的觀點,此問題唯一明智的答案是,若這兩個檢驗的H[,0]的后驗概率近似相等,則這種近似就告成立,而出現(xiàn)這種情況的一個很強的條件是,觀測值的似然函數(shù)在(0-b,0+b)近似為常數(shù)。(注:對貝葉斯分析而言,直接處理區(qū)間的假設(shè)比審查用簡單假設(shè)做近似是否合適來得容易。但為了和經(jīng)典作對比,也可以進行簡單原假設(shè)的貝葉斯檢驗。)
就關(guān)于正態(tài)總體均值的簡單假設(shè)檢驗而言(設(shè)方差已知),眾所周知,所用的檢驗統(tǒng)計量是z.假如先驗的具體值為μ=θ0,π0=1/2(π0為使原假設(shè)成立的參數(shù)集合之先驗概率),σ=τ,則對各種z(選擇它使之相應(yīng)于經(jīng)典的雙側(cè)P[,-]值,或假設(shè)為簡單假設(shè)的檢驗顯著性水平α)及n的后驗概率由上表來給以列出。
此表的數(shù)值令人驚訝。因為若由觀測值得到z=1.96,經(jīng)典理論拒絕H[,0]的顯著性水平σ為0.05.給人的印象是,這個值越小H[,0]越可能不成立。但H[,0]的后驗卻很大,從n較小時的約1/3,到n較大時的接近于1.而當z=1.96時,(對此具體先驗而言)事實上幾乎不提供拒絕H[,0]的證據(jù)。貝葉斯推斷與經(jīng)典推斷的結(jié)論恰好相反(這矛盾被稱作Jeffreys悖論或Lindley悖論,人們發(fā)現(xiàn)它已近半個世紀了)。
這里有一個問題需要說明,即如何解釋經(jīng)由概率抽樣且樣本容量適中,在顯著性水平α為0.05水平上卻作出了關(guān)于正態(tài)總體(方差已知)均值的簡單假設(shè)檢驗?
筆者認為,這一悖論能促使我們進一步思考貝葉斯推斷的特點,深化我們關(guān)于從樣本推斷總體的認識。不言而喻,貝葉斯方法認為樣本的作用是使對θ的認識深化,由先驗分布轉(zhuǎn)化為后驗分布。后驗分布包含了θ的先驗信息與樣本觀測值提供的信息(先驗密度因此不再包含任何信息),從而形成貝葉斯推斷的基礎(chǔ)。問題在于,“先驗分布轉(zhuǎn)化為后驗分布”是否具有完全性。特別是在經(jīng)典推斷與貝葉斯推斷所得結(jié)論不相協(xié)調(diào)時,更應(yīng)謹慎從事,例如可結(jié)合數(shù)據(jù)并注意到先驗密度來對模型的適用性展開研究。這時,相關(guān)的會計專業(yè)知識及會計實踐經(jīng)驗就能發(fā)揮作用。
「參考文獻」
[1][美]Watts & Zimmerman.陳少華譯,實證會計理論[M].東北財經(jīng)大學出版社,1999.
[2]張朝宓、蘇文兵。當代會計實證研究方法[M].東北財經(jīng)大學出版社,2001.
[3][美]Berger.賈乃光譯,吳喜之校譯,統(tǒng)計決策論及貝葉斯分析[M].中國統(tǒng)計出版社,1998.