“助推”失靈了嗎?


“助推”失靈了嗎?

在這週三的文章中,我們講了“影響因子”是如何影響頂級科學期刊的。我還注意到一件事,那就是在這次新冠肺炎疫情的全球暴發中,這些“神刊”的應對速度大大加快了。像知名的《新英格蘭醫學雜誌》,一篇關於新型冠狀病毒的論文提交不到48小時就發表了,這在之前是難以想象的。要知道,平時一篇論文提交後經過編輯審核、同行評議到最終發表,一般要花上幾個月的時間。

這種快速響應雖然有利於信息共享,但也更容易出問題。之前,印度科學家發表的一篇關於新冠病毒的論文就因為數據和結論有缺陷,遭到了大量同行批評,最終被撤回。

我們都知道,科學是要求“可證偽性”的。可在現實中,如果一個領域的研究成果總是被證偽,那對這個領域而言絕對是一場毀滅性打擊。我最近就在《自然·新聞特寫》上看到了一篇文章,說當代認知心理學的熱門研究領域“社會啟動”,正在遭受這樣的生存危機。

所謂社會啟動(Social Priming),簡單來說,就是你能事先通過一些微小的刺激或暗示,左右一個人接下來的行為。很多知名的社會科學讀物,像《助推》《思考快與慢》《先發影響力》,都大量引用了社會啟動領域的研究成果。

可這篇文章卻說,近年來一系列針對社會啟動的可重複性實驗都失敗了。也就是說,這個領域的很多結論都靠不住,這可引發了不小的爭議。下面,咱們就一起來看看這是怎麼回事。

有一個著名的社會啟動效應,你可能聽說過,叫“熱咖啡效應”。2008年的一項研究宣稱,如果人們手裡捧著一杯熱咖啡,那他們對別人的態度就會更友善,評價也會更正面。

別小看這個結論,它有著很強的實用性。我有一個做保險的朋友就曾經跟我說,她約客戶簽單時,就會選擇請客戶去咖啡店,喝上一杯熱咖啡,再吃點甜食。她覺得這能增加簽單率。你看,這是不是就是一種熱咖啡效應?

可問題是,後來針對熱咖啡效應所做的重複性實驗卻失敗了,新的研究人員沒能再現這個結論。熱咖啡效應,沒能經得起檢驗。

還有一些結論也存在問題,比如最經典的“語義啟動”。當時,心理學家發現,當人們被一些特定詞彙啟動後,識別和處理同類詞彙的速度也會更快。比如,在看到“醫生”這個詞後,他們識別“護士”的速度就比識別其他詞要快。

最早的啟動效應研究,可以追溯到上個世紀七十年代。在這之後,語義啟動的研究還拓展到了行為變化上。1996年,紐約大學心理學家約翰·巴赫(John Bargh,熱咖啡效應的研究就是他做的)研究發現,如果看到和年老有關的詞彙,比如皺紋等等,受試者走出實驗室的速度會比對照組更慢,就好像他們真的變老了似的。

還有研究發現,被“金錢”這個詞啟動過的人會更自私;被“教授”這個詞啟動過的人,在解謎時的表現會更出色。

這些結論聽起來是不是特別有意思?可惜,它們同樣沒能被成功重複。美國南佛羅里達大學的心理學家道·羅勒(Doug Rohrer)去年6月發表了一篇論文,說他重複了關於“金錢”啟動效應的實驗,發現實驗組的表現和對照組根本沒啥差別。

這還不是個例,有幾十項社會啟動效應的研究成果都無法重複。不少科學家宣佈,他們不再把社會啟動看作是能影響人們無意識行為的方式。

《心理科學》雜誌的副編輯、多倫多大學心理學家邁克爾·因茲利奇(Michael Inzlicht)甚至明確表示,他對社會啟動從完全信任變成了徹底懷疑。

那你可能會問:為什麼社會啟動領域會有這麼多的研究成果無法重複呢?難道是科學家故意造假嗎?

別說,還真有故意造假的情況,一個著名案例就是荷蘭權威社會心理學家德里克·斯塔佩爾(Diederik Stapel)。

斯塔佩爾曾經發表過很多篇人類行為學方面的論文,有些結論很吸引眼球,比如“人在骯髒的環境中更容易種族歧視”“吃肉會讓人變得更加自私與不合群”等等。但隨後,他卻被自己帶的學生揭發,說他數據造假多年。

為什麼要造假?斯塔佩爾後來解釋說,自己從小就喜歡整潔和規律,而實驗數據的雜亂讓他感到煩躁,於是就把它們改得漂亮些。他追求的不是真相,而是“美”。何況學術期刊也更喜歡發表“美”的數據。

這個解釋當然很牽強,但其中也反映了一部分真實情況,比如學術期刊的確更傾向於發表“陽性”的結果,也就是能證明假設的實驗結果。可是,實驗數據常常沒有明確指向性,要想讓數據“有意義”,科學家得做點什麼。最low的做法,就是造假了。

不過,造假畢竟有身敗名裂的風險,於是有些研究者會用一些“巧招”。比如說,他們會用各種統計方法來分析實驗數據,然後只挑選某個能僥倖達到顯著性的結論,隱瞞其他結果。甚至有個說法是:理論上,只要用一些噪音大的數據,再加上小一點的樣本量,研究者就能得到任何想要的結果。

還有研究者是“已知結果後假設”,也就是先看數據怎麼樣,再改變最初的假設。換句話說先打哪,再指哪,這不就不會出錯了嗎?

除此之外,在科研中還存在一種“實驗者效應”。如果研究者知道自己在研究啟動效應,那麼他們從實驗數據中發現這種效應的可能性就更大。也就是說,研究者自己的潛意識就能左右研究結果。

那麼,這是不是意味著社會啟動領域的研究成果都不能再相信了呢?倒也不是。

有研究者在使用了更嚴格的統計方法之後發現,社會啟動效應還是存在的,只是比預期的要小得多,而且也存在個體差異。比如用“節食”“瘦”“苗條”這類詞啟動,確實會讓有些人選擇更健康的食物,但這些人大多是原本就想減肥或者崇尚健康飲食的人。

這說明什麼呢?說明啟動效應並不像之前大家認為的那樣是普適性的,它有限制條件。目前來看,當啟動信息與個人目標相一致的時候,更容易產生啟動效果。

不管怎麼說,社會啟動這個研究領域是衰落了。文章中提到,如今做社會啟動研究的人比十年前少多了。一方面這個領域深陷“重複性危機”,研究成果容易遭受質疑;另一方面,社會啟動這個課題之前太熱門,現在有點過氣了。

好在,經過爭論和反思,科學家們的研究方法比之前更嚴謹了。主要有兩個積極的變化:

一個是增加了統計樣本數,尤其是在做重複實驗的時候。文章中提到一個叫Many Labs的項目,就讓數十個實驗室的本科生分別重複相同的心理學研究,這樣就能獲得數以千計的樣本,可以更全面地檢驗前人的研究結果,剔除那些有瑕疵的結論。

另一個變化,是“預註冊”方法的推廣。也就是說,科學家會先把研究的假設和實驗方案在期刊上進行預註冊,而期刊也承諾,無論實驗結果如何都會發表。這就能有效防止研究者“已知結果後假設”的行為,也會防止研究者為了能發表論文而從主觀上干預實驗結果。

好了,總結一下,在今天的文章中,我跟你分享了社會啟動領域陷入可重複性危機背後的原因。簡單來說,就是研究者自身的主觀意願和傾向影響了實驗結果,製造出了很多站不住腳的結論。

我讀這篇文章的時候能明顯感覺到,社會啟動效應的這場危機讓很多人失望了,畢竟這個領域的研究成果往往都特別實用。你想,誰不希望能用微小的成本去影響別人的行為呢?這種四兩撥千斤的美夢,我們每個人都做過。不過好在,雖然我們離這個夢更遠了,但是我們卻離還原世界的本來面目更近了。


分享到:


相關文章: