暴發調查系列九:混雜及其機制

暴發調查系列九:混雜及其機制

上一期我們計算了優勢比,對變量"saltegg",同樣可以計算其優勢比

cc(case,saltegg)
暴發調查系列九:混雜及其機制

計算的合計有效記錄是1089,略高於"case"和"eclair.eat" 交叉列表的合計907.優勢比雖然不一樣大但有統計學意義。 與分析"eclair" 的優勢比類似,圖中右邊的箱子遠大於左邊的箱子,表明暴露的比例較大。

乳酪餡和鹹蛋的優勢比都具有統計學意義,並且有較大比例的參與者食用。檢查一下這兩個變量間的關係。

cc(saltegg,eclair.eat,graph=FALSE)
暴發調查系列九:混雜及其機制

上述結果表明可能只有一個真正的病因,另一個只不過是混襲因素,即那些吃鹹蛋的參與者也傾向於吃乳酪餡。以下的分層分析給出了混雜的詳情。

mhor(case,saltegg,eclair.eat)
暴發調查系列九:混雜及其機制

暴發調查系列九:混雜及其機制

如圖,上述關於疾病和鹹蛋間的關係是按吃乳酪餡的水平分層進行的,它是建立在case,saltegg和eclair.eat三個變量均為有效值得記錄基礎上的。

分析結果包括兩個主要部分,第一部分是由第三個變量定義的每層的暴露優勢比,本例為Mantel-Haenszel方法計算的"eclair.cat"的優勢比和χ2統計量。第二部分建議這些層的優勢比是否可以合併。

我們先把重點放在第一部分,然後再來看第二部分。

兩層的優勢比都接近1且沒有統計學意義,兩條線的斜率都比較平穩。Mantel-Haenszcl (M H)優勢比是兩個優勢比的加權平均值,也接近1。

兩層的各層優勢比和M-H優勢比都與1沒有統計學意義,但粗優勢比有統計學意義。粗優勢比與真實的或者調整後的優勢比之間的偏差稱為混雜。

混雜的原理可以用上圖進行解釋。位於圖形中靠上的線表示吃了乳酪餡的觀察對象的子集或層,而下方的線代表的是未吃的。

上方的線遠離下方的線,意味著吃乳酪餡人群的危險遠遠高於未吃者,兩條線之間的距離是16到32的優勢重疊部分。需要注意的是,本例中吃乳酪餡和鹹蛋的對象分佈是不均衡的。

在右邊(即吃鹹蛋者),吃乳酪餡者(上方的箱子)遠遠多於沒有吃的人(下方的箱子),因此右邊的中心有向上方箱子的位置靠攏的趨勢。

相反,在左邊,即沒有吃鹹蛋的人群中,沒有吃乳酪餡的人數(由下方的箱子大小表示)多於吃了的人數,所以左邊的中心趨於更接近下方的箱子。即把兩層數據合併後,吃鹹蛋人群中患病的優勢(加權平均)更接近上方的箱子。

左邊也是如此,患病的加權平均優勢更接近上方的箱子。右邊較高的平均優勢導致用優勢比大於1,該粗優勢比使我們錯誤地認為鹹蛋是另一個病因,而事實上它僅是因乳酪餡的混雜干擾。

只有遇到以下兩種情況時,混雜的水平才值得關注。首先,分層因素必須是獨立的危險因素,其次在分層因素和所關心的暴露因素間的聯繫必須有統計學意義。

現在,我們來檢查吃鹹蛋是否會對患病和吃乳酪餡之間的關係產生混雜。

mhor(case,eclair.eat,saltegg)
暴發調查系列九:混雜及其機制

暴發調查系列九:混雜及其機制

以saltegg分層,兩層的"elair.eat"的優勢比(19.3和24.8)和M-H優勢比(24.3)都非常接近粗優勢比(23.68).

上圖顯示,各層的兩條線非常接近,表明saltegg 不是獨立的危險因素。在暴露組和非暴露組,患病的優勢都接近加權平均優勢,沒有受觀察對象數量的影像。因此不是獨立危險因素的變量,不會對另一個暴露變量產生混雜干預。


分享到:


相關文章: