科學的概念、理論及其檢驗

科學的概念、理論及其檢驗


科學的概念、理論及其檢驗


本次的新冠疫情無疑是對我們分辨真相的能力與科學素養的挑戰。之前的文章(我們知道什麼,而我們應該相信什麼?)我們講到了真相的檢驗標準與方法。在當代,科學無疑是在事實的發現和檢驗上有著最為成熟實踐的領域,而在其成功的背後其實是有一套完整的理念作為支撐的。


科學中的概念


科學建立在對現象的歸納之上,現象是可以被觀測的事件,而不可被觀測的事件在科學研究的範疇之外,比方說靈魂是不可觀測或感知的,所以它不是科學所研究的概念。


科學中的概念與日常的概念不同,科學概念中的定義是具備可操作性的抽象規則,可操作性意味著任何人都可以通過實施可測量的操作對概念進行檢驗。比如說“焦慮”一般而言指的是一種個人化的感覺,不能被其他的觀察者知悉,而心理學家會使用問卷量表和生理指標測量這樣的操作來定義“焦慮”這個概念。可以觀察到隨著科學的發展,分類學與測量學也蓬勃發展了起來。可觀測與可操作性標準使概念從個人化的直覺與感覺中分離,能夠被重複驗證的前提。


概念的操作性定義需要兼具信度與效度。以智力測量為例,信度要求測量結果之間需要前後一致,而效度意味著這個測量結果是否是智力水平的有效表示。如果使用某一IQ測試在3天內分三次測量同一個人的智力得出的結果分別為60、160和104,那這個智力測量是不具備信度的。而如果智力測驗測量的是該人的身高,雖然會得出一個高信度的結果,比如說170,但這一數值並不能表示該人的智力水平。缺乏信度和效度的操作性定義都是無用的。


科學理論與可證偽性


科學理論是對現象所反映的規律的歸納,那科學理論是永遠無法被證實,而只能被證偽的。發現很多隻白天鵝並不能證實“世界上只有白色的天鵝”的理論,而只要發現一隻黑天鵝就能證偽這個理論。科學理論需要遵循“可證偽性”的原則,如果一項理論能夠解釋所有可能發生的情況,那麼任何一種情況的出現都不可能證明這個理論是錯誤的:


18世紀,支持放血療法能夠治療黃熱病的醫生對患者的治療結果有著這樣的看法:如果病人死掉了,病人就被認為已經病入膏肓,無藥可救了;如果病人康復,這個病例就作為支持放血療法有效的證據。


無疑這種看法是不可證偽的,它永遠都不可能被修正。當一種理論採用免於被證偽的措辭方式時,理論也就失去了進步的可能,如果一個理論能夠解釋所有的結果,理論本身也就喪失了任何預測能力。


反之,當一個理論預測越為精確具體,可能證偽它的現象就越多,這個理論就更加可信。舉個例子,如果問題是估計一個人的年齡,第一個理論作出的預測為32歲,而第二個理論預測該人的年齡小於100歲。第一個理論無疑暴露在更多證偽的可能下,如果第一個理論預測正確,那麼該理論無疑是更加可信的。


同樣的,若兩個理論有著同樣的預測能力,我們應傾向於選擇較為簡單的理論,因為較為簡單的理論涉及更少的概念或概念間的關聯,那麼理論就更易證偽,這就是著名的奧卡姆剃刀原則。


科學的獨特優勢在於通過可證偽性來消除自身錯誤以迫近客觀真理。而令一個理論能夠解釋一切結果並變得無法駁倒無疑是一個極具吸引力的陷阱,不可證偽性能夠給人提供一種對事件虛妄的控制感,如果我們仔細考察世俗智慧,其實可以發現許多智慧或多或少都是有所矛盾的:


  • “三個臭皮匠頂個諸葛亮”與“三個和尚沒水吃”
  • “順其自然”與“力爭上游”
  • “果斷行事”與“三思而後行”
  • “小心駛得萬年船”與“不入虎穴,焉得虎子”
  • “同性相斥,異性相吸”與“物以類聚,人以群分”


這種世俗智慧屬於“後見之明”的智慧,雖然能對事後的結果進行解釋但卻缺乏對未來的指導能力。


科學的驗證與假說的排除


科學的一般流程是通過對問題的觀察提出合理的假說,然後科學工作者會根據問題採集有代表性的數據樣本對假說進行驗證,驗證的結果可能支持也可能否定這個假說成立。若其他合理的假說均被否定,剩下的被驗證所支持的假說就成為了一個可靠的科學理論。


科學的驗證過程就是去偽存真的過程,其驗證可以根據數據的採集方式分為兩類,分別是統計分析與實驗分析。實驗分析允許科學工作者對實驗相關的變量進行直接地控制,而統計分析只能被動的採集世界中實際發生的數據,一般而言實驗分析比統計分析的結果更加可靠。


統計分析一般用於因客觀條件或倫理要求而無法直接控制問題相關變量的情形下,將統計方法簡單應用於因果推理時,可能引發各種推理謬誤。其中最為著名的就是虛假相關問題,即兩個變量之間統計相關但沒有因果關係,因為它們實際上同被另外的變量所影響。舉個例子,樹每年都會長高,而全球生產總值基本上每年都會增長,如果拿這兩個變量的數據進行相關分析,無疑會是正相關。但實際上樹的高度與全球生產總值並無因果關係,它們共同被時間所影響。


所以科學工作者一般更喜歡使用實驗對假說進行驗證。為了平衡樣本自身的所有其他無關的變量,需要將樣本隨機分配為實驗組與對照組。並將對照組和實驗組置於高度一致的環境中,以充分排除實驗過程對實驗結果的影響,在實驗中僅操縱自變量以考察其變化對因變量的影響。而為完全排除實驗操作者和實驗被試的主觀期望對實驗結果的影響,更嚴格的實驗還會要求“雙盲”,即操作者和被試在實驗時均不知道自己屬於實驗組還是對照組,實驗後這些數據才對實驗結果進行公開分析。


著名的“安慰劑效應”就是因被試的主觀期望而產生的,安慰劑效應指的是,是接受某種治療行為這件事本身,就足以令相當一部分人感覺病情好轉,與治療是否有效無關。安慰劑效應的效力是很強大的,安慰劑效應在抑鬱症治療中是29%(即29%的病人服用安慰劑後報告症狀緩解了),在十二指腸潰瘍中是36%,在偏頭痛中是29%,食道炎是27%。所以一種藥物是否有效要看的是,服用這個藥的實驗組與服用不含任何藥物的安慰劑的對照組相比是否有更大比例的被試報告病情好轉。


科學理論的概率性表述


我們生活在一個或然的世界中,面對複雜的現實,科學同樣也必須要處理概率問題。大量的科學定律使用概率而非確定性的表述,科學的概率性表述只是表達了一種概率趨勢,個例或者有選擇性的證據往往並不構成對科學的否定,可惜的是人一般不擅長用概率思維進行思考,這常常導致對科學的誤解或誤用。


人們似乎期望自己生活在確定性的世界中,面對偶然性事件,人們也有對其作出解釋的傾向。有一個著名的實驗能很好地反映這種傾向,實驗中,被試需要猜測接下來紅/藍兩盞燈哪一盞會亮,實驗會進行多輪,每次被試猜測正確將給與一定獎勵。但被試不知道的是,實際上每一輪都是隨機的以70%的概率亮紅燈,30%的概率亮藍燈。在多輪實驗過後,被試大多意識到了紅燈多數會亮,但被試卻相信燈亮是遵循一定模式的,被試實際上在紅燈和藍燈之間來回選擇。最好的策略應該是一直選擇選項A,而來回選擇的策略正確率最多隻有58%(70%*70%+30%*30%)。“開了這麼多把大的,下次一定開小的”,這種賭徒心理同樣也反映了這種傾向。若對偶然性事件進行過度解釋,會導致對科學的誤解。


而人對概率的感知會受到事件形式的影響,人往往會高估鮮活、個人見證的事件發生的比例。實際上,在20公里路上乘車的死亡風險要比乘飛機飛行750公里的死亡風險高出3倍。人同樣也不擅長概率推理,即使受過高度訓練,也可能不由自主地犯下統計謬誤。舉個簡單的例子,如果每10001人中有1人攜帶某一傳染病病毒,再假設有一種檢查可以百分之百地診斷出真正攜帶病毒的人而這個檢查有0.5%的假陽誤診率。假設所有人都做檢測,檢測呈病毒陽性反應的人真的是病毒攜帶者的概率大約是2%(51分之1),因為每10001人中會有50名正常人會被錯誤地檢測出陽性反應(5%)。


結語


現實是無比複雜的,我們深切的渴望相信自己是可以控制自己生活中的事件。而對這種控制感的迷戀,卻使得我們掉入思維的陷阱之中。科學家並不會宣稱他們可以提供完美的知識,科學的獨特優勢並不在於它是一個不會犯錯的過程,而在於它提供了一種消除錯誤的方式。科學讓知識公開化,讓任何有衝突的觀點都能以一種雙方都接受的方式被檢驗。科學正是這麼一步一步接近現實的。


科學的概念、理論及其檢驗


《這才是心理學:看穿偽心理學的本質(第10版)》 基思·斯坦諾維奇

《為什麼 :關於因果關係的新科學》 朱迪亞·珀爾

《科學發現的邏輯》 波普爾


分享到:


相關文章: