說人話的統計學——終點·起點|協和八

從2015年6月30日的第一篇《你真的懂p值嗎?》,到上個月的最新一篇《廣義線性模型到底是個什麼鬼?》,【說人話的統計學】專欄在將近三年的時間裡,已經一共推送了將近60篇文章。今天,我們在此告知各位讀者朋友,我們在協和八公眾號與大家的統計學之旅將要正式告一段落了。這當然不是我們憋不出來新文章、一時拍腦門的決定,而是早前確定的計劃。然而,與其說這是一個終點,我們更願意把它看作一個新起點——我們計劃把過去兩年多來辛勤耕耘的這片園地,在進一步改進提升以後,再以嶄新的面目呈現給更廣大的群體(到底是什麼計劃?接著往下看!)。

話別之際,我們都有一種千言萬語不知從何說起的感覺——對諸位讀者的謝意與不捨,對協和八這個平臺和眾小編的感激,專欄寫作過程的體會與收穫,展望未來對大家、對自己的期待,一時竟不知從何下筆。既然如此,不如我們乾脆就換個形式,來個輕鬆隨意的對談吧。我們想象著你——我們親愛的讀者——就坐在我們身邊,分享這段聊天。當然,我們十分期待你能在這篇推送下給我們留言,把你的所想所感告訴我們,真正參與到我們的對話中(批評和吐槽當然歡迎!)。

说人话的统计学——终点·起点|协和八

Z(張之昊):兩年多的時間,說長不長,說短也不短。現在,我們這個專欄算是完成了階段性的任務,要不咱們先說說此時感想如何吧?

T(田菊):其實感想還挺複雜的。完成近60篇的推送,真的是很大的一個工程,要是一開始就知道要寫這麼多,可能都不敢開始了。真的感謝一路陪伴我們的讀者,還有各位協和八的編輯們——沒有你們,也就不會有這麼多“說人話的統計學”專欄文章。

之前寫推送文章真是很花精力,現在告一段落,心情輕鬆了許多。以前輪到我寫推送的時候,我老公老是督促我週中寫完,這樣週末就可以出去玩兒了,但是作為拖延症晚期患者,常常拖到週末都寫不完,心裡也是挺慚愧的。回顧之前寫專欄的過程,最大的感受,是覺得自己對很多統計問題的理解也加深了很多,感覺很幸運能和讀者們一起進步。最後,就是期待將來將這些文章整理成書,讓書裡面的內容更連貫,把一些沒有機會寫入連載文章的想法也加進去。

Z: 是的,我也首先想在這裡,向各位讀者表示深深的謝意——無論你們是否讀到這段對話,我們兩位作者都對你們充滿了感激,你們一直以來的支持和鼓勵,是我們最大的動力。

同時,我們也要感謝協和八各位同仁辛勤的幕後工作。也許作者總是吸引了最多的目光,但編輯們的無私奉獻同樣是不可或缺的。兩年多來,協和八主編徐源一直以極大的耐心和熱情,支持著“說人話的統計學”。他總對我們說,不必被點擊量這些東西牽著鼻子走,只管用心做最高質量的作品。在微信這個充滿投機者的環境裡,能有這樣一心一意為讀者、為作者做奉獻的領導者,是值得所有人珍惜和感謝的。陳茹萱、劉洋、鄒林峰三位編輯先後負責我們專欄,他們不僅是我們文章的第一讀者,更以一絲不苟的排版校對工作,架起了我們與讀者之間的橋樑。另外,陸逸雲、趙彧墨、王文達、費凱倫等其他幾位編輯也在不同時候當過“救火隊員”,幫過我們大大小小的忙。而所有這些,都是在他們本已極為繁重的協和醫院、醫學院的臨床、科研、學習工作之餘完成的。他們不愧是協和精神新一代的繼承者。我也深切地感到,能與一群志同道合的朋友一起,不計回報地做一點小小的事情,是一種極大的幸運。

回到寫作本身,對於你剛才所說的與讀者們一起進步這一點,我特別認同。一方面,這兩年多來隨著自己科研工作的要求,對統計學的理解在不斷深入,現在回過頭來看早先寫下的文章,也會發現一些不夠完善的地方。另一方面,我們不時看到有讀者在文章底下留言,提到我們的文章幫助他們理清了之前沒有弄明白的東西,以及解決了科研上的問題,這時是最有成就感的。

说人话的统计学——终点·起点|协和八

T:話說回來,當初你是怎麼決定開始寫這個專欄的?當時就計劃會寫兩三年這麼久嗎?

Z: 這個專欄的開始完全是沒有預謀的。2015年的時候,協和八公眾號剛剛起步不久。主編徐源與我是多年的好朋友,我想起幾年前博士一年級時,隨手寫過一篇在耶魯與美國的醫學生一起上神經解剖學課的感受,也許協和八的讀者會感興趣,就給徐源投了個稿。這篇推送以後,徐源問我還有沒有什麼其他人生感悟值得分享的,我想人生感悟我恐怕沒什麼資格瞎說,別的話題也許還能做點貢獻。當時博士已經讀到了五年級,統計學的知識和經驗在幾年間課程和實踐的摸爬滾打裡有了一些積累,加上那會兒我還在耶魯的StatLab為學校師生(尤其是醫學院和附屬醫院的學生、教授和臨床醫生)提供統計諮詢服務,也對於醫學科研中常見的統計學問題和方法有一些體會。於是,我就問徐源,開個統計學專欄怎麼樣。徐源對這個想法很支持,因而就有了“說人話的統計學”。那個時候哪裡知道是挖了這麼大一坑兒呢(笑)。

這個專欄的定位和計劃也隨著寫作的深入,漸漸有些變化。起初,我的想法是零散地寫一些問題,也介紹一些新趨勢、新思想,並沒想要按照一個嚴格的體系來寫。對於寫多少、寫多久,也沒有很具體的計劃。最開始的幾篇文章推送以後,讀者的反響很不錯。當時微信還沒有在文章底下留言的功能,但許多讀者在公眾號的後臺留言,鼓勵我把這個專欄寫下去。我很認真地想了想,覺得自己在統計學的學習和實踐過程中走過不少彎路,尤其是書本上理論知識的學習和科研工作中的具體實踐之間,其實有不小的差距。如果能通過這個專欄,幫助讀者縮短這道鴻溝,也許是很有意義的一項工作。於是,我就調整了一下思路,後來的文章圍繞著幾個核心思想和方法展開,希望能讓沒有統計學基礎的讀者也能從基本概念和思想開始,系統地掌握科研實踐中重要的統計學方法和模型的使用。要實現這樣一個目標,在每兩到三週一篇推送的頻率下,確實需要兩三年的時間。也多虧有你後來的加入和通力協作,不然這個時間可能還會更長!

T: 剛才你提到了學習統計學的心路歷程,能具體說說你為什麼會對統計學感興趣嗎?

Z:我本科的時候,上過兩門正牌的統計課,一門是概率論與數理統計,一門是生物統計學,另外還在一門偏重數學建模的課程裡接觸過一點線性模型和優化問題。那個時候學得很認真,也覺得概率論裡頭有些思維方式很有趣,但真正對統計學的理解是很模糊的,更別說具體的應用了。後來出國讀博以後,因為從事的是基於大量數據的實驗科學,統計學就變成一項必備的工具了,不論喜歡也好,不喜歡也好,總得會那麼幾招,而且還要根據實際工作的需要,學習新的統計學知識。但坦白說,博士期間頭幾年,還是說不上對統計學本身有太大的興趣。

轉折點發生在我誤打誤撞選修的一門多元統計學課程,這門課的授課老師是耶魯統計系和環境學院的Jonathan Reuning-Scherer教授。他並不是什麼特別有名的統計學大腕兒,但在教學方法上很有一套。一般來說,統計課給人的印象往往是枯燥無味的,但他開的幾門課在耶魯的學生之間赫赫有名,幾乎堂堂爆滿。為什麼呢?他的講授非常重視對統計學方法的直覺把握,時常用各種巧妙的比喻甚至實物展示來幫助學生理解一個數據問題的本質,以及它的解決思路。在這個基礎上,再討論嚴格的數學形式和理論證明,就一下子變得有意義、有來由,而不是一堆冷冰冰的符號和定理了。再加上他不知道哪裡來的表演天賦,不時插科打諢甚至高歌一曲,連手上的教鞭用的都是“星球大戰”的光劍(聽說是從他兒子那兒借來的),總把大家逗得很開心——他曾經在一次採訪裡說過,在他看來,課堂教學與戲劇、音樂、舞蹈一樣,都是一門表演藝術。當然了,後面的這些,要我說,在某種意義上是個“誘餌”,為的是把對統計學望而生畏的學生們吸引到它精妙的世界裡。

這門課給了我看待統計學的全新視角:它不僅可以很有用,而且很有趣,很深刻。後來,出於興趣自己又找了許多書籍和論文來看,也上了一些其他的統計學課程,進一步加深了自己對這門學科的認識。我還曾看過我國已故統計學家陳希孺院士的《數理統計學簡史》,這本書寫得很精當,從歷史的角度梳理了統計學的發展歷程,也以生動的筆觸介紹了高斯、貝葉斯、費希爾、戈塞特等數學家、統計學家的治學之道。這兩年來從事博士後研究,接觸到了許多新的領域,以及這些領域中統計學與其他學科的交叉融合,比如人工智能、自然語言處理等等,更覺得這是一個值得自己一直探索下去的學科。

我說了這麼多,要不你也分享一下你對統計學的感受和經歷吧?

说人话的统计学——终点·起点|协和八

T:我自己的話,大學的時候因為必修課的原因上過一門隨機數學的課,學得比較多的是概率分佈這一塊,統計的東西涉及的不太多。當時我就是把它當一門數學課來上的,而不是作為解決實際問題的工具,在課堂上也沒有意識到統計學對於科研的重要性。話說回來,那時候學的幾乎所有的數學知識似乎都停留在了“解題”的層面上。

我意識到統計學的重要性,是從進入實驗室開始的。聽組會里高年級的學長分享新採集到的科研數據,大家一塊兒批判性地討論學術期刊上的文章,在這些過程中我逐漸學到了各種實用的分析方法。

剛才你提到,你讀博期間上的一門統計課激發了你對統計學的興趣,其實我也有類似的經歷。我當年選修了Alan Agresti教授教的“線性與廣義線性模型”的課。他是佛羅里達大學的教授,因為統計課教得特別好,就常被邀請到哈佛上線性模型的課,而我上的那學期恰好是Agresti教授教的。他寫過不少高質量的統計學教科書,尤其是關於分類變量的分析方法的。(Z:我也看過Agresti的兩本統計學教材,真羨慕你聽到了真人版!)Agresti教授上課,特別善於將抽象的線性代數概念用簡單的幾何形式來解釋,中間也不時穿插統計學家的小故事,引人入勝。他的課理論與實踐結合得恰到好處,在講完新的方法之後就會接著具體的數據集講解實際應用中的問題。

讀博士以後,自己親身走過了設計課題、採集數據、分析數據、發表文章、文章悲劇、做更多的實驗,做更多的分析、發表文章這一系列過程(此處省略三萬字)之後,才對統計學的實際應用有了更多的經驗。比如設計課題的時候要做功效分析,分析數據的時候會用到各種假設檢驗的方法等等。與此同時,我也開始認識到,整個生物科研領域對統計方法的使用上還存在許多問題,比如大家都太看重p值,很多科研結果的可重複性並不高。要解決這些問題,不僅需要統計學理論和方法的進步,也需要科研從業者統計學知識和素養的提高,而這正是我們專欄希望能盡一點綿薄之力的。

Z:之前許多讀者也對你在Facebook的工作感到很好奇,能不能也講講你現在的工作內容與統計學之間的聯繫?

T:在Facebook作為一個數據科學家,我的工作重點是應用統計方法解決商業問題。在互聯網產品開發中,我們常常通過A/B檢驗來判斷一個新的功能是不是比舊的功能更好。所謂A/B檢驗,其實就是統計學中的假設檢驗問題。在做實驗時,我需要考慮到統計功效,決定測試的樣本量,從而合理控制成本。此外,我還要選擇合適的指標,作為判斷那個版本更好的依據。很多用戶行為的數據都不符合正態分佈,這時就要考慮用什麼樣的統計方法最能達到目的,或者該不該對數據做log變換等等。這些問題往往沒有固定的答案,要具體情況具體分析,這也更讓我確信,學習統計學方法背後的原理,比隨便套用公式要重要得多。在工作中,抽樣調查也非常重要,這就是通過抽取一些樣本進行測量,進而對總體的某個特性作出推斷的過程,在社會科學的研究中是非常重要的手段。這部分的知識,我們專欄在討論t檢驗和抽樣分佈的時候稍微涉及到了一點,以後整理出書的時候有機會也可再多講一點。

前面我們都提到,各自在學習統計學的過程中都走過一些彎路,你覺得我們的“說人話的統計學”系列可以怎樣幫助讀者儘量少走彎路? 許多人對統計學裡面繁雜的數學公式望而卻步,對於這樣的讀者你有哪些建議呢?

说人话的统计学——终点·起点|协和八

Z:在清華上本科時,對我影響最深、激發我走上現在的科研道路的,是經濟系系主任鍾笑寒老師。他在課堂上一直強調,“用少量的知識思考廣泛的問題”(A little knowledge goes a longway),後來他在一篇文章裡,把它翻譯成“大道至簡,道不遠人”。雖然鍾老師說的是經濟學的學習和實踐,但我覺得對於其他學科是完全適用的,自然也包括統計學。所謂“少量的知識”,當然不是說我一知半解就可以胡謅了,而是說一個學科、一個理論體系也許看起來很龐大,有很多繁瑣複雜的細節,但它最基本、最核心的概念、思想和方法往往是很簡單的。比方說,統計學裡最常用、最有力的工具線性模型,它的數學形式(不同自變量效應的線性疊加)任何一個初中水平的人都能看懂。理解這個形式的意義,就是看懂、用好線性模型的關鍵。至於說那些什麼極大似然估計、廣義線性模型的數據變換和連接函數之類,都是一些技術性的手段,並不改變它的本質。

因此,要把統計學學好、用好,我個人覺得,很大程度上在於對那些核心思想的把握,這些才是最重要的“道”。在此基礎上,再針對具體問題掌握一些解決問題的“術”,其實就能應付相當多的數據分析問題了。這也是我們過去兩三年來,寫作“說人話的統計學”專欄的指導思想。

T:確實如此,我也很有同感。我感覺雖然統計學有特別多的數學公式,但它跟純粹的數學還挺不一樣的。比如說,大數定律在很大程度上來源於實際經驗的總結,貝葉斯公式也只是用數學語言來描述與我們認知相符合的一種推理過程。所以,形成對統計學的方法和概念的清晰、準確的直觀理解,會比死記硬背公式要有效得多。

說到這裡,也正好可以和大家分享一下,為什麼我們決定在現在將專欄的微信推送停下,轉向寫作和整理書稿。關於寫到什麼時候收尾,我們也討論過好幾回了,選擇這個節點是個經過深思熟慮的決定。正如你剛才說的,不論是專欄還是書,我們的願望是幫助讀者們對統計學的核心思想有一個比較透徹的認識和理解,並且基於這些基本思想,熟悉一些常用的方法。專欄從最開始的概率分佈、p值和功效分析、貝葉斯定理等基本理論,寫到t檢驗和方差分析,再到線性模型及廣義線性模型,一路讀下來的讀者應當能夠打下比較堅實的基礎。即使因為實際工作的需要,要學習其他我們沒有講到的方法,也不會毫無頭緒了。統計學博大精深,如果要“無死角”覆蓋,可以永遠寫下去,但那樣的話,一是不現實,二來也有悖我們的初衷了。

Z:是這樣的。當然,這條線具體畫在哪兒,也很難說有絕對意義上的最佳選擇。很久以前,我們也挖過一些坑,提到過有些內容以後會再詳細講,但現在因為剛才談到的原因,可能暫時不再列入計劃內了。如果有一些讀者在等待這些內容的話,我們也藉此機會向你們致歉。在廣度和深度之間、擴大覆蓋面和加強重點之間權衡取捨,總是很難做到十全十美,因此希望大家能夠理解。如果大家對特定的統計學內容有強烈的需要,歡迎大家在這篇文章底下留言,我們一方面也許可以在力所能及的前提下推薦一些其他資源,另一方面也可以在整理成書時考慮增補有普遍需求的內容。

说人话的统计学——终点·起点|协和八

T:既然講到出書,那麼我們最後和大家預告一下這本書將會是什麼樣子的吧?

Z:好的!首先我想說的是,既然這本書脫胎於“說人話的統計學”專欄,我們會繼續保持專欄已有的風格和框架。這包括幾個方面:

第一,我們面向的讀者,依然是沒有統計學基礎、或者曾經上過一兩門(也許不太愉快的)統計課但是已經對學過的知識印象不深的人群。而且,我們不希望讀者陷入繁雜的數學細節中(這也是毫無必要的),因此閱讀這本書並不需要太多數學背景,具備高中數學的基礎知識就夠用了,如果略有一點微積分基礎會有幫助,但並不是必須的。

第二,我們希望在嚴格的、理論主導的和“菜譜”式的、只講用法不講原理的統計學書之間找到一個平衡點,這也是前面我們談到過的“大道至簡”的信念。我們希望讀者們能從我們的書中領略到統計學的一些核心思想方法,並且掌握一些常用的方法,而且具備進一步學習其他更為專門的統計學方法的能力。因此,我們的書既可以是一本獨立的統計學入門讀物,也可以是閱讀其他更為正式的教科書時的補充。

第三,我們希望將來這本書的閱讀體驗是愉悅的。我在上本科的時候,一些中文教材(不一定是統計學)有時候會讓我很有挫敗感——許多教材的作者,似乎都在做一個假設,就是在讀某章某節的時候,讀者已經把前面所有章節的內容理解到了與作者相當的程度。我至今都還記得那些一整個晚上把四五頁書翻來翻去還毫無頭緒的感覺,以及那種不知道該生誰的氣(自己還是作者?)的惱火。從教學的角度出發,這種假設也是完全不符合認知規律的。也許熟悉我們專欄的讀者會注意到,我們在文章之間的思路銜接上下了不少功夫,而且在新內容與曾經講過的內容關係密切時,也不會吝惜用來回顧之前內容的文字。在整理成書時,我們也會保持和發揚這個風格。我們希望(而且也有這樣的自信),我們會比那些個心裡沒有讀者的教科書作者做得好得多。

此外,愉悅的閱讀體驗還需要許多其他的元素,比如說流暢清晰(甚至偶爾抖個包袱賣個萌)文字,有信息量的、與文字相互補充的插圖,優質的編排和版式設計等等。這些我們也都會盡力做到高水準。

T:是的。具體到內容上,雖然我們之前的推送也遵循了一個大體的知識框架,但由於連載這種形式的限制,加上整體的計劃是在寫作過程中才逐漸確立的,所以在系統性上偶爾還是有些欠缺。我們會在修訂過程中著力改善,力爭為讀者奉獻一部精品。與此同時,也希望大家能夠多給我們提意見和建議。大家在推送文章和協和八後臺的留言,因為條件限制,我們不一定能每一條都回復,但是,所有的聲音我們都一定會認真傾聽。

说人话的统计学——终点·起点|协和八

Z & T:最後的最後,再次感謝協和八讀者們的支持與鼓勵,能在這裡與你們分享知識,共同成長,是我們的驕傲!

質控:異葉青蘭

* 點擊下方標題,或回覆關鍵詞「說人話的統計學」可隨時查閱本系列任意文章!

说人话的统计学——终点·起点|协和八

乾貨

第 1 章 高屋建瓴看統計

第 2 章 算術平均數與正態分佈

第 3 章 t 檢驗:兩組平均數的比較

只講 p值,不講效應大小,都是耍流氓!

第 4 章 方差分析(ANOVA):多組平均數的比較

第 5 章 線性迴歸:統計建模初步

第 6 章 廣義線性模型:統計建模進階

自檢

番外篇

说人话的统计学——终点·起点|协和八

張之昊

说人话的统计学——终点·起点|协和八

2010 年本科畢業於清華大學生命科學學院,獲理學學士學位。2016 年 5 月在耶魯大學跨院系神經科學項目獲得哲學博士學位。在耶魯期間,他利用功能核磁共振成像(fMRI)技術與計算建模研究人類經濟決策的腦科學基礎及其與肥胖症的聯繫,曾以第一作者身份在 Nature Communications, Current Biology 等頂尖學術雜誌上發表多篇論著,並受到 BBC 新聞、CBC、洛杉磯時報、果殼網等知名媒體的關注和報道。他還曾任耶魯大學 StatLab 數據諮詢師(Data Consultant),為耶魯師生提供實驗設計、數據分析及統計學軟件的諮詢服務。2016 年 8 月至今在伯克利加州大學(UC Berkeley)哈斯商學院市場營銷系擔任博士後研究學者(Postdoctoral Scholar),致力於運用神經科學、經濟學模型、自然語言處理及大數據方法研究消費者行為與決策。

田菊

说人话的统计学——终点·起点|协和八

2010 年本科畢業於清華大學工程物理系,獲工學學士學位。2016 年 5 月在哈佛大學醫學院神經科學項目獲得哲學博士學位。她在攻讀博士期間研究基於獎賞的學習行為的神經迴路及其計算模型,曾以第一作者或共同作者身份在 Nature,Cell,Neuron,Nature Neuroscience,Trends in Cognitive Science 等頂尖學術雜誌上發表多篇論著。2016 年 6 月至今在 Facebook 擔任數據科學家( Data Scientist ),運用大數據和人工智能解決網絡詐騙、虛假新聞和不良廣告等信息安全相關問題。

说人话的统计学——终点·起点|协和八


分享到:


相關文章: