來源:http://www.gotome.com.tw/tongji/2011-02-16/156.html
統計學的應用隨著微型電腦的普及越來越廣泛,在社會科學實證研究中幾乎是無處不在。有了一定規模的資料和一個統計分析軟體,就可以很方便地進行各種估算和分析。然而由於統計分析方法本身並不像加減乘除那樣簡單,而一些統計分析軟體已經發展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作並得到結果,可能出現對統計分析方法誤用或濫用的現象。本文僅對一些統計分析中比較常見的問題進行討論,以引起各方面的重視。
鄭真真 (北京大學人口研究所 副教授)
1 描述性統計
描述性統計是社會科學實證研究中最常用的方法。準確、全面、正確的描述是所有實證分析的基礎,如果對某個事件或某種現象的描述不清楚或存在偏差,那麼其後的所有分析都將是值得懷疑的。一項研究能夠將所研究的現象或物件描述清楚,就是一個極大的貢獻;而描述的偏差可能會引起公眾或學術界對某些社會現象的誤解,甚至誤導政府決策。但是因為描述性統計所用方法簡單易得,往往沒有得到足夠的重視。
均值的局限 普遍用於描述樣本集中趨勢的測量之一是均值。它對於近似正態的對稱分佈樣本來說是比較好的測量,對於不對稱分佈則不然,尤其會受到極端值的影響。兩個分佈完全不同的樣本可能會有相同的均值,因此均值在某種程度上抹殺了樣本內部的差異,而往往這種內部差異正是需要我們進行深入研究的、或應當引起人們注意的。為了彌補均值的這個缺陷,一般在報告均值的同時也報告方差,或用直方圖/散點圖的形式描述分佈,以提請讀者注意群體內部的差異。
不同群體的可比性 在描述性統計中,往往涉及到對不同時期或不同人群的總體描述,以反映社會變化或地區差異。在社會科學中、尤其是人口研究中,不少事件的發生都是與年齡密切相關的,如我國婦女大部分在35歲以前完成了生育,從而導致35歲以上育齡婦女中極高的避孕現用率。在這種情況下,兩個樣本之間存在避孕現用率的差異可能只是年齡結構的差異,而不是年齡別避孕現用率的差異。又如在報告流動人口犯罪問題時,給人的印象往往是流動人口犯罪率高於常住人口,但忽視了流動人口的年齡和性別構成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對兩個不同群體的比較往往會導致錯誤的結論。
絕對數的使用 由於中國人口數量巨大,調查研究也比較容易得到大容量的樣本,所以對任何小概率事件用絕對數報告都會出現驚人的巨大數位,單純對絕對數的強調往往會產生戲劇性的效果。比較合理的方式一般是在報告某事件絕對數的同時,給出該事件的發生率或占研究人群的比例。
小樣本的代表性 在一次抽樣的小樣本中求得的率或比例會非常不穩定,與另一次抽樣的結果可能會有較大差距。因此當研究僅限於從小樣本獲得的資料時,應當在報告比例的同時也報告樣本量。
2 雙變數統計分析
在社會科學研究中,首先分析的往往是兩個變數之間的關係,如用相關或列聯表等方法。一般在確定兩個變數之間確實有某種關係,如在經過統計檢驗後證實兩變數有顯著相關關係,進行更進一步的分析才有意義。因此,雙變數統計分析在實證分析中佔有重要地位。但是,由於在應用中對有些問題的忽視,雙變數統計分析也很容易出現偏差或錯誤。
卡方檢驗的局限 在利用列聯表對兩個定序/定類變數進行相關分析時,需要進行統計檢驗來判斷兩個變數的相關是否有統計上的顯著意義。不少研究結果都用卡方檢驗的顯著性報告相關狀況。但值得注意的是,卡方統計量的計算本身是有局限性的,樣本越大,卡方值就會相應增大,因此大樣本的卡方檢驗很容易得到顯著結果。所以一般在報告卡方檢驗結果以說明兩變數是否顯著相關時,還應當同時報告相關強度,即相應的相關係數,如Gamma,Lambda等。
統計意義上的顯著與差別的實際意義 在檢驗兩個定距變數的均值差別是否具有統計上的顯著性時,也存在相似的問題。由於樣本量越大,樣本均值分佈的方差就越小,因此常用的t檢驗結果就越可能顯著,任何細微的差別都可能有統計上的顯著性。但有時具有統計意義顯著性的差異,在實際生活中可能意義並不大,如同在兩個草堆之間找出一根草的差距,對判斷兩個草堆的大小沒有實際意義。因此,對任何檢驗結果都應當有符合實際的解釋和說明。
虛假相關問題 雙變數分析中的虛假相關問題,幾乎在所有關於社會科學研究方法的教科書中都會涉及到,在統計分析方法的教學中也被視為經典問題。但是多少年來,人們仍然在不斷地重複著這個“經典的錯誤”,即認為可見的或統計檢驗結果顯著的相關就是真正的相關;更為大膽的做法是把這種相關關係推向因果關係。我們知道,對於有的變數來說,即使是經過檢驗判定兩者具有統計上顯著的相關關係,也不一定存在實際意義上的關係,因為可能有未考慮到的變數或不可測量的變數在同時對兩個研究變數起作用,有時甚至可能完全是偶然的巧合。例如,火災的大小是以火災損失來衡量的,而參加滅火的消防員人數是與火災大小有關的,火災越大,出動的消防員就越多,但凡是具有常識的人都不會根據出動消防員人數和火災損失兩個變數之間的高度相關,斷定出動消防員越多火災損失就越大,因為火災的規模是決定因素(但很難直接衡量)。在有關人口科學研究中也有報告虛假相關的現象,如人口增長率的降低導致了經濟增長的提法就是一例。因此,在分析相關關係時,應當根據理論、知識、經驗、甚至常識來判斷這種分析是否有意義、是否存在其他變數的作用(稱為外在變數),避免得出有悖於常理的分析結果。有些虛假相關是可以通過統計分析方法判別的,如在控制了另外一些變數後觀察兩個變數的偏相關,或在雙變數分析的基礎上,進一步用多變數分析深入研究。
3 多變數分析
回歸分析是多變數分析中應用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應用。在眾多應用中,比較明顯的問題是使用方法是否得當和對結果的報告和解釋是否規範、合理(見2002年第2期《人口研究》劉金塘文)。此外還有一些應當引起注意的問題。
分析框架的重要性 在社會科學研究中,各變數之間往往存在錯綜複雜的關係,如果在進行回歸分析之前沒有一個清晰合理的分析框架,那麼回歸的結果有可能會引起質疑。一般應在報告回歸分析結果之前,介紹該分析的框架,如各變數的定義、各引數與因變數的假設關係及其理由等,對建立的回歸模型做出合理性論證。有一些變數可能是作為控制變數納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對假設因果關係的模型,應當至少能夠說明:(1)該因果關係在理論上是正確的、在實踐中是合理的;(2)從事件發生的時間上來說,應當是原因發生在先、結果發生在後。如有些回歸分析中,未加說明即把所有與因變數顯著相關的變數都囊括在引數中,甚至有些引數與因變數有明顯的互為因果關係,顯得分析邏輯混亂;還有的論文在簡單介紹研究背景和資料來源之後,急於建立因果關係並推出回歸分析結果,然後再根據各變數在回歸模型中的顯著性一一說明,這相當於事後解釋;這些做法都是錯誤的。
在具備“奔4”微機和較易操作的軟體的今天,轉瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準備工作,包括文獻檢索和理論框架構建,才能確保統計分析的科學性。
分析方法應用的條件 每種多變數方法都有各自的前提條件或假設,如果這些條件不具備或者假設不成立,該方法的應用就成問題。如Pearson相關是考察線性相關關係,多元方差分析只能辨別線性相關因變數的多元差異,線性回歸分析假設引數與因變數之間為線性關係,因數分析方法也是建立在各變數具有一定的線性相關基礎之上的;另外,在邏輯斯蒂回歸中,每個分類都應保證有足夠的頻數,如果頻數太少就會影響參數估計的穩定性;等等。儘管一般不在報告分析結果時說明各種假設是否成立或條件是否滿足,但是在進行分析時應當自覺地進行考察。如果不能滿足條件或假設不能成立,就對資料進行轉換或調整後再分析,或者改變分析方法。
多變數分析結果的展示和解釋 多變數分析的結果一般是通過列表來展示的。現在一種並不少見的做法是直接把統計軟體的輸出直接複製到論文中,我們往往會在文章中看到包括回歸參數估計、參數標準差、檢驗統計值、檢驗顯著性、偏相關係數等等n行m列的大表,使人有目不暇接的感覺。實際上參數標準差和檢驗統計值是提供給分析者的信息,沒有必要列在結果中;如果不是有特別需要的話,偏相關係數也不是關注重點;最主要的應當是回歸參數估計及其顯著性。
在列出分析結果之後,應當對結果的實際意義進行解釋和討論,而不是復述分析結果的數學意義。此外,在多元統計分析中一個常見的問題是分析者對變數作用不具有預期統計顯著性的失望,因此繞開不顯著的變數,甚至對資料或模型進行各種調整以獲得顯著結果。其實,統計分析結果不顯著往往也是有實際意義的。例如在分析我國高齡老人的地區分佈時發現,高齡老人比例與當地醫療衛生指標沒有顯著關係,這說明我國醫療系統還沒有具備延長老人壽命的功能;另一方面也說明這些高齡老人的存活不是主要靠醫藥維持的。所以,在解釋分析結果時,只要是在分析框架中涉及並參與分析的變數,無論作用顯著與否,都應當給予充分的討論;對於那些由於知識或信息的限制難以下結論的結果,可以作為問題提出,以便進行更有針對性的進一步研究。
此外,任何方法都有其局限性,分析結果也不會十分完美。因此在討論結果的同時,也應當就此向讀者說明。例如當一個多元線性回歸分析的確定係數較低時,需要指出該模型有限的解釋能力,探討可能存在但沒有納入分析的更重要的影響因素。
不必求最新、只求最合適 有些研究生在撰寫學位論文時,常常因為自己沒有應用最新的統計分析方法而感到忐忑不安;在評論某項研究的創新性時,有時也出現把學術創新和應用新方法混為一談的現象,例如認為應用描述性統計方法的研究水準低於應用解釋性或預測性方法的研究。新方法是層出不窮的。但是,出現了新方法並不意味著傳統方法就不再適用,而是各有千秋。統計分析方法是工具,哪件合適就用哪件,能用錘子解決的問題不必開衝床。有時越是複雜的方法,假設條件也會相應較多,應用的局限性更大。因此,盲目追求方法的新穎並不是高水準研究的保證,真正需要注意的是使用最合適的方法。而對所用方法的真正瞭解,是正確運用統計分析方法的前提。
留言列表