跨文化比較研究中的可比性問題

比較研究中的可比性

跨文化比較研究的數據給研究者在不同國家之間進行對比和理論檢驗帶來了便利,但是同時帶來了可比性的問題。態度和偏好在國家間存在異質性,雖然研究人員常用分層模型來適配,但是這種方法只解決了不同國家的態度差異,往往忽略了不同國家的非隨機測量誤差而帶來的系統性偏差。為此,作者使用了分層混合項目反應理論模型(multilevel mixture item response theory model)來解決這一問題。

跨文化比較研究中的可比性問題

由於個人態度無法直接觀測,故研究人員往往利用因子分析將某一態度的不同面向得分進行整合,用因子得分代替態度潛變量。在比較研究中,這一方法的問題在於其忽略了不同國家民眾回答問題的系統性差異,這種方法效應(method effects)造成巨大的測量誤差。目前的部分研究表明,有些國家的民眾有選擇極端選項的傾向,而有些國家的民眾更傾向於選擇中間選項避免極端選項。這意味著有相同傾向的個體可能會選擇不同的選項,影響如下圖所示:

跨文化比較研究中的可比性問題

所以在研究中,需要區分因測量問題而帶來的系統差異和不同國家間的態度真實差異。儘管如此,我們卻不能因噎廢食而放棄比較,這樣我們會失去大量的信息。作者認為因子分析模型無法解決這一問題,需要利用其它的測量模型來區分兩種差異。

多層混合IRT模型

作者利用類似於廣義線性模型的方式將變量進行潛變量連續化。對於國家k的個體j選擇項目i中c選項的概率來說,有

跨文化比較研究中的可比性問題

跨文化比較研究中的可比性問題

其中代表項目i中潛在傾向的因子荷載,。為強度係數(intensity),其中閾值越高,則越有可能通過(多級項目反應理論)。

則對於不同的選擇概率有

跨文化比較研究中的可比性問題

將不同國家的態度差異納入考慮中,則形成一個二層的分層模型,第一層為題項,嵌套在第二層個體中,第二層的方程為

跨文化比較研究中的可比性問題

上述模型僅解釋了不同國家的真實態度差異,如果再將不同國家的測量系統差異考慮在內,模型則變為

跨文化比較研究中的可比性問題

跨文化比較研究中的可比性問題

上述兩個模型的圖示如下。左邊的圖示A表示解釋變量x和國家間態度的差異對個體態度潛變量的影響,不考慮國家間的系統測量差異。而右邊的圖示B將國家間的系統測量差異納入考慮範圍中,即國家層次的變量對個體態度的潛變量既存在隨機效應,影響大小為γ,也存在國家間的系統測量誤差對最終結果的直接影響,影響大小為δ。

上述模型為傳統的參數假定,即認為這種國家間系統差異的隨機效應服從均值為0的正態分佈。但是也可以做非參數估計,認為這種影響受到某些離散的混合因素所影響。換句話說,隨機效應不是連續的,而是有M個因素混合而成的離散隨機效應。模型為

跨文化比較研究中的可比性問題

其中加入約束條件,。這樣做的好處在於:其一,這種方法生成了數量有限的國家的混合體,它們共享同一參數值,約束條件使得模型可以估計出不同國家相對於總體均值有偏響應概率的大小;其二,由於比較研究中國家數量較少,故研究人員不會假定這一參數的正態性。而設定非參數的類別潛變量可以避免正態假定,依據混合成份的數量來進行近似估計,產生所謂的非參數極大似然估計值。

技能特殊性和社會支付偏好

在建立完模型後,作者利用建立好的模型來進行數據分析,檢驗模型的可用性。作者考慮了民主國家的再分配問題。再分配被認為是富人向窮人的一次性轉移,一般來說,收入越高者再分配傾向越低。作者認為,技能能夠改變收入和再分配傾向的關係。在保持收入不變的情況下,特殊技能和普通技能的優勢比越高,個體越傾向於再分配支出。也就是說,對這種社會保障性再分配支出取決於中間選民的技能結構。

為了驗證以上觀點,作者使用了1996年國際社會調查(International SocialSurvey Programme)數據,用政府在健康、失業和養老金上的支出來表示社會保護性再分配支出。同時,作者將工作狀態,年齡、性別、信息獲取和左右政黨支持來作為控制變量。

跨文化比較研究中的可比性問題

上圖是IRT模型的可視化,由圖顯示,因子荷載和強度係數均顯著,且不同的閾值(thresholds)分佈比較均勻,誤差較小,整體的估計比較精確。

跨文化比較研究中的可比性問題

跨文化比較研究中的可比性問題

上圖則是失業和養老金的國家間系統差異係數的估計。縱座標為不同的國家,由圖可知,來自澳大利亞和新西蘭(AU,NZ)的國家系統差異最大,也即測量偏差最大。這不僅證實了國家間測量差異的存在,也證明了不同國家的測量差異的大小存在區別。

上表是模型的迴歸係數和95%的置信區間,由表可知,不同國家的系統差異(Discrete Random Effect)對因變量有顯著的直接影響,且不同國家的影響程度不同。其他自變量的影響也都表現顯著。收入的協方差係數為負驗證了收入越高,越不支持再分配的理論。技能的協方差係數為正說明工人對勞動力市場風險的預估和對社會保障性再分配的需求。

最後,作者將使用因子分析的線性迴歸模型、分層模型和作者提出的分層IRT模型所計算出的結果進行了比較。

跨文化比較研究中的可比性問題

上圖顯示,在沒有考慮國家間系統測量差異的線性迴歸模型和分層線性模型中,估計的係數基本都小於多層IRT模型所估計的係數。作者認為,如果研究人員忽略了國家間的測量偏差,那麼最後所估計出的結果就是有偏的。在作者的模型中,這一偏誤的影響在估計收入和非全職工作的協方差係數時特別明顯,傳統的分析說明這兩個變量是沒有影響的,但是分層IRT模型證明二者對社會再分配傾向有著理論上預期的影響。這一模型給過往的研究提供了更為清晰的證據。


文獻來源:Daniel Stegmueller(2011), "Apples and Oranges? The Problem of Equivalence in Comparative Research." Political Analysis, 19(4): pp.471−487.

作者簡介:Daniel Stegmueller,杜克大學政治學系副教授,研究方向為政治經濟學、政治行為和比較研究中的貝葉斯模型和穩健推斷。

編譯:劉天祥


分享到:


相關文章: