「硬核」:清華大學教授教你研究生學位論文如何選題

摘自:機器之心


清華大學計算機科學與技術系長聘教授、人工智能研究所所長劉洋的在線報告《淺談研究生學位論文選題方法》最近幾天成為了朋友圈刷屏的內容。


很多人可能都會看過劉洋老師的論文寫作 slides《機器翻譯學術論文寫作方法和技巧》,它已經成為學術圈內公認的高質量寫作指導,甚至成為了很多老師編寫指導方法參考的標準。


劉洋老師的報告是清華大學近期推出的官方在線課程《清華大學雲上課堂》的一部分,讀者可以搜索該話題獲取更多課程內容。


下面摘自機器之心,進行了部分整理:


學位論文顧名思義,是為研究生學位、博士學位而撰寫的科學論文。各所大學對於學位論文都有不同的要求,但基本都會要求論文的作者掌握堅實寬廣的基礎理論和系統深入的專門知識,具有獨立從事科學研究工作的能力,在科學或專門技術上做出創造性的成果。


想要做到正確的選題,必須要樹立正確的「科研三觀」。


什麼是科研的三觀?可以這樣理解:


  • 世界觀:科研界的發展規律;
  • 人生觀:研究生階段我們要實現的目標;
  • 價值觀:如何實現自我價值。


這對於我們的選題和研究產生很大影響。學術界是一個推陳出新的世界,個人的努力對於成功的影響非常重要,你能力的上限基本上等於成功的上限。這意味著你應該積極創新,努力將人類的知識體系向前推進一步。雖然每個人讀研、讀博的目的不一樣,但這一期間也是人最具創新能力的時期,我們應該充分利用好時間,全面鍛鍊自己的能力。


「硬核」:清華大學教授教你研究生學位論文如何選題

所有的科學研究都圍繞著「提出問題」和「回答問題」而展開。我們應該在讀研的過程中保持好奇心,並願意為之付出努力。在科研過程中,最重要的是不要停止提問。


什麼是有價值的研究?


但如何判斷我們提出的問題是否具備研究價值呢?這就涉及到「選題的十大標準」。


「硬核」:清華大學教授教你研究生學位論文如何選題


重要性和創新性


劉洋老師提醒大家,在選題的時候,首先要考慮的是選題的重要性,要評估該問題在學科發展主脈絡上的地位;其次是創新性,研究的這個問題應該要能夠突破人類知識的邊界,創造新的知識。


以人工智能歷史上發展的脈絡為例,可以看出研究選題必須要遵循重要性的標準,重要問題應該是學科發展過程中在主脈絡上的關鍵問題。重要的方向在於懸而未決的重要挑戰,以及制約發展的關鍵瓶頸。


「硬核」:清華大學教授教你研究生學位論文如何選題


下圖中的外圈代表人類知識的邊界,內圈代表個人知識的範圍。上到大學之後,我們開始在某個方向上積累知識,研究生階段的選題也是在這一基礎上進一步選擇一個方向。

在讀研過程中,你會達到人類知識體系邊界的某個點,這是通過閱讀某個細分領域的大量文獻完成的,也是讀研第一階段,即學習知識的階段。


第二階段是創造知識,要通過突破邊界來實現,產生新的知識。如果你創造的知識非常重要,也就認為你達到了研究生畢業的標準。所以,創新性是在讀研階段非常值得強調的一個要素。


前沿性


第三個要素是「前沿性」。學科發展總在動態變化,如大海中的潮流。在下圖中,縱座標代表關注度,即學術界有多少人在關注這一主題;橫座標代表成熟度,即該主題目前被研究得有多麼透徹。


「硬核」:清華大學教授教你研究生學位論文如何選題


超一流學者往往會研究一些關注度和成熟度都很低,但在 5 到 10 年之後可能會成為主流方法的課題。由於成熟度很低,這類課題往往風險很高,所以不是所有研究者都敢去做,也不是所有人都能意識到其重要性。


一流學者往往會研究一些「已經有人發現可能有用」的主題,他們會在前人的基礎上進一步擴展。二流學者會選擇當前最熱門的一些方向。三流學者則會選擇已經處於衰落期、成熟度很高的方向。最後剩下的是不入流的學者,他們往往會選擇一些非常過時的主題。


學術大潮浩浩蕩蕩,如果順應大潮(圖上左半部分),就會事半功倍,你的工作就很容易產生巨大影響力;反之,如果你選擇的問題非常陳舊,即使你再拼命、再努力,你做的工作也不可能產生太大的影響。


以人工智能領域為例。20 年前,最熱門的研究話題還是最大熵模型等,深度學習則備受冷落。


「硬核」:清華大學教授教你研究生學位論文如何選題

到了 2010 年,深度學習已經開始受到關注(Hinton 和他的學生在 2006 年發表了利用 RBM 編碼的深層神經網絡的 Science 論文:《Reducing the Dimensionality of Data with Neural Networks》)此時進入深度學習方向一定能夠做出非常一流的工作,因為有大量的空間有待探索。相比較而言,之前一些比較熱門的方向已經走向衰落期。


「硬核」:清華大學教授教你研究生學位論文如何選題


到了 2020 年,深度學習正處於當紅階段,如果此時你還在追逐深度學習方向,可能做出的工作會是二流的。目前或許有一些一流、超一流的工作正在開展,只是我們還無法確定是哪些方向。可能是量子計算,也可能是認知科學或其他交叉學科等。


「硬核」:清華大學教授教你研究生學位論文如何選題


任何學科都有這樣一個大潮。重要的是,你要把當前能夠想到的所有方向按照上面的方法進行分類,把它們歸到這五個區間內,以此來區分前沿問題和非前沿問題。


在這種選擇問題上,「『勢』很重要,要順勢而為」。就學術界而言,研究生需要關心的是哪些問題處於「一流」的區域(「超一流」難度太大,研究生三五年解決不了;二流區域創新性較弱)。


「硬核」:清華大學教授教你研究生學位論文如何選題


探索性


研究問題的「探索性」即目前問題的解決程度和未來可能的創新空間。如果你發現一個問題已經被解決地很好了,即已經跳出了學界的範圍,走向了工業界,那麼這個問題的探索空間就會小很多。所以,大家一定要保證自己選擇的方向有足夠的空間施展手腳。


「硬核」:清華大學教授教你研究生學位論文如何選題

基礎性


「基礎性」指的是,我們希望自己的選題是這個學科中非常基礎的問題,它能對本學科和相關學科產生廣泛而深遠的影響。以樹為喻,我們選擇的問題應該儘可能在「根」或主幹上,這樣一來,後面生出的枝葉、成果都會受到你的影響,直接體現就是你的文章引用量非常高。


「硬核」:清華大學教授教你研究生學位論文如何選題


以人工智能領域的最優化問題為例。如果你能提出一種非常好的最優化算法,幾乎所有人都會引用你的成果,這就是一個非常基礎的研究方向,也是劉洋老師鼓勵大家選擇的方向。


複雜性


「複雜性」是指你選擇的問題要有足夠的體量和複雜性,能夠支撐你做三年、五年的研究。這個問題要能夠拆分成幾個創新點,即若干個子問題。通常,每個創新點要對應一篇論文,三篇(或兩篇)論文對應一篇學位論文。


「硬核」:清華大學教授教你研究生學位論文如何選題


系統性


前面講到,你選的問題要能夠拆分成若干子問題,但這樣還不夠,這些子問題之間還應該密切關聯、有機銜接、渾然一體。也就是說,你做的問題要有系統性。

「硬核」:清華大學教授教你研究生學位論文如何選題


此處,劉老師給了一個博士論文的反例:《xx 方向上的若干問題研究》。「若干」表示你研究的幾個子問題是割裂、孤立的,寫出的學位論文也是非常糟糕的。


所以,你在選題的時候就要做好頂層設計,想好未來幾年要做的工作,這些工作要分為幾個方面。同時,你還要保證未來三年這幾個子問題不過時。


除了學生之外,導師在選題方面也扮演著非常重要的角色。許多 CMU 的導師將幫學生選題視為最重要的職責,這樣才不會耽誤學生,浪費學生的才華。


可行性


「可行性」是指你選擇的問題應該具備在短期內被解決的可能性。


「硬核」:清華大學教授教你研究生學位論文如何選題


「我們不會做時間旅行(time travel)、teleportation 和反重力的研究,因為它們不是重要的問題,我們想不到該怎麼解決。」


一個重要的問題必須是 reasonable 的,是必須有解決方法的。在科研工作中可以雄心勃勃,但是要在起步階段將其拆解成三年之內可解決的問題。千里之行,始於足下。


承接性


「承接性」是指你所在的課題組有良好的工作積累,能夠提供最大的助力。


「硬核」:清華大學教授教你研究生學位論文如何選題


牛頓說過,我們要「站在巨人的肩膀上」。你可以儘可能地站在課題組的積累之上,也許你的導師、前輩對這個問題很熟悉,同時實驗室也有大量的儀器設備,有各種數據,都可以幫助你更順暢地進行研究,更快地進入角色並且取得成果。


當然,這個東西並不是一個必要的,只要你足夠勤奮,一樣能夠通過自己的努力,在新的方向上做出新的工作。尤其是對於機器學習領域來說,很多數據、研究工作都是開源的,它的承接性並不像其它學科那麼強,例如生物學科所需的大型設備。


適合性


最後還要提一下適合性,即自己對該問題感興趣,能夠充分發揮出自己的優勢。成功取決於能否將自己的特長髮揮到極致,要學會揚長避短。


做科研和打遊戲一樣,有各種能力上的要求,比如表達能力、邏輯思維、自我管理能力、反思能力等。找到自己的優勢所在,才會如魚得水。


如何進行選題?


講完了選題標準,接下來要講的是具體的選題步驟:


毛主席說過:「指揮員的正確部署來源於正確的決心,正確的決心來源於正確的判斷,正確的判斷來源於周到的和必要的偵察,和對於各種偵察材料的聯貫起來的思索。」


這段話來源於《中國革命戰爭的戰略問題》,是毛澤東 1936 年 12 月在延安的中國抗日紅軍大學的一次演講。我們完全可以把這個軍事理論套用到學術論文選題上,如下圖所示:


「硬核」:清華大學教授教你研究生學位論文如何選題

這個過程裡面,有三件事很關鍵,一是調研,二是思索,三是判斷。


但現在有一個問題,我們在調研過程中,是先提問題,然後帶著問題讀文獻;還是先讀文獻,再思索並提出問題?


劉洋老師說:「這兩種方法各有優勢,先讀文章,然後根據批判性思維提出自己的 Idea,是非常好的一種方法。很多人說,如果你沒有 Idea,那麼讀到 100 篇、300 篇論文時一定會有新思路。而如果先針對問題仔細思考自己的見解,再看他人的研究,就會有非常高的獨立性,通過自己 Idea 與文獻的碰撞,能有更好的思路。」


所以,這兩種選題思路都是可行的,它們各有優劣。


學術第一步:多讀文獻


「硬核」:清華大學教授教你研究生學位論文如何選題


勤讀文獻,及時更新知識結構,站在領域前沿,包括但不限於經典著作、期刊雜誌、會議文集、學者主頁、社交媒體和預印網站,這些渠道都有各自的特點:


  • 經典著作的選擇加州大學伯克利分校的 Michael I. Jordan 教授的機器學習書單;
  • 期刊雜誌層面,注意閱讀領域內和領域外的期刊雜誌,學科交叉容易產生創新;
  • 會議文集的時效性高、質量上乘,甚至 AI 領域頂級的研究工作都是發表在會議上的,是最佳平衡點;
  • 及時瞭解本學科頂級學者的研究問題也很重要,熟悉前沿對你的選題很有幫助;
  • 社交媒體已成為學術成果的重要發佈場所,很多美國學者都喜歡在推特上發出自己的研究成果,甚至比論文更早;
  • 另一個信息來源是 arXiv 預印本論文網站,對於計算機學科來說,該網站的時效性是最強的,但論文質量參差不齊。


但問題在於:論文這麼多,我們怎麼讀?


論文那麼多,劉洋老師表示我們一定要權衡好粗讀與精讀之間的關係。可能 80% 的論文只要看論文標題就行,只需要有一個印象,回頭遇到了某些問題再找出來就行。


因為只需要閱讀 20% 的論文,差不多就能獲得 80% 所需的信息,所以後面重要的一步就是加深我們對這些知識與研究成果的思考。根據已有的信息,劉洋老師表示我們需要構建自己的知識體系,加深理解程度,並形成個人觀點。


想象一下,我們的知識體系就是一個知識圖譜,每篇論文是一個節點,不同節點之間可能存在連接,這些連接表示論文之間的聯繫。可能某些節點的邊非常多,這表明由它延伸的研究非常多,它們就是關鍵論文。


對於如何找到那部分該詳讀的 1%,我們可以把讀論文看作是一個漏斗的形狀,我們先看 80% 的論文標題,再看 20% 論文的摘要,這樣最後「漏出來」1% 的論文就需要搞懂全部細節了。這是一個自然的篩選過程,而不是直接選定那 1% 的文章。


此外,我們也可以找師長詢問某領域的必讀論文,並把它們作為入口。一般而言,論文的閱讀順序可以表示為:必讀論文、領域先驅發表的論文、前沿論文。


獨立與勇氣


定選題肯定是需要獨立思考的,不能把希望寄託在他人身上。尤其對於國內的很多同學,我們不應該太依賴於導師的建議,還要發揮自己的觀點與思路。當然,獨立思考並不意味著封閉,聽取導師、學長和同學的建議也是非常重要。


國內科研工作者相對而言會比較保守,因為高回報一般意味著高風險,我們不太敢嘗試一些全新、有重要價值的探索。因此,在獨立思考後,我們還要不畏風險,有勇氣去做一些具有挑戰性的新研究。這些新研究正因為風險比較高,其門檻也比較高,當然競爭也就會少一些。


「硬核」:清華大學教授教你研究生學位論文如何選題

有勇氣挑戰新問題的人是很難得的,他們要面臨著各種壓力。


最後,確定選題


不論前面是做文獻調研還是構建自己的知識體系,最終我們也是需要確定選題的。在找到一些候選研究主題後,我們可以通過簡單地打分來理性判斷。


如下劉洋老師給出了他個人的權重設定,他認為重要性、創新性和前沿性這三個指標是特別重要的。候選 1 最後的綜合得分最高,它代表著創新性與前沿性非常高,但同時風險也比較大;候選 2 與候選 3 表示更為平庸的一類研究主題,但它們非常安全,能保證做出成果。


「硬核」:清華大學教授教你研究生學位論文如何選題


作為個人建議,劉洋老師還是非常提倡選擇創新性高的研究問題,這樣才不會浪費年少時光。


學位論文的選題是重大決策,它越早確定越好,同時確定了就不要更換,不然的話研究會更為緊湊且讀研花的時間更長。正因為選題的重要性,所以弄懂什麼是好的研究主題就顯得特別重要,這個標準並不一定取決於上表 10 條量化準則,同時還取決於自己的知識體系與觀點等各個方面。


「硬核」:清華大學教授教你研究生學位論文如何選題


劉洋老師簡介:清華大學計算機科學與技術系長聘教授、人工智能研究所所長,國家傑出青年基金獲得者。研究方向是自然語言處理,在自然語言處理和人工智能領域重要國際刊物和國際會議上發表 80 餘篇論文,獲得 ACL 2017 傑出論文獎和 ACL 2006 優秀亞洲自然語言處理論文獎。獲得國家科技進步二等獎、中國電子學會科技進步一等獎、中國中文信息學會錢偉長青年創新一等獎、北京市科學技術獎二等獎等多項科技獎勵。擔任或曾擔任國際計算語言學學會亞太分會執委兼秘書長、Computational Linguistics 編委、ACM TALLIP 副編輯、中國中文信息學會青年工作委員會主任。


劉洋:《機器翻譯學術論⽂寫作⽅法和技巧》

http://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf


分享到:


相關文章: