經驗丨搜集文獻的整體步驟

前言

以下是我以自己的課題為例,掛一漏萬,純粹拋磚。閱讀科研文獻主要是分三節講述,第 1 節主要是講蒐集文獻的整體步驟(此篇詳細講解),第 2 節主要講具體得到一些 Paper 的資源,如何去整理,第 3 節是講在查找和閱讀文獻時如何記筆記。以下的方法可能只適用於外文文獻,因為我基本上不看中文的文獻。中文期刊的編年慣例、CNKI 和維普等數據庫的功能等等都有些不一樣。

在寫之前我想向各位研究生讀者先聲明一句:沒心搞研究的,將來不想當科學家的,準備考公務員或者找工作,讀博只想隨便對付一下的同學,就不用看這篇文章了。因為這篇文章講的所有東西在你們眼裡都是毫無必要,傻冒之極,連搞笑的效果都達不到。

文獻的“主流化”

剛開始讀研究生,不管是導師給你的題目也好,自己上網看到的也好,一開始你手頭上有的只是一兩個代表著你興趣點的關鍵詞(Keywords)。也許如果題目是你自己找來的,你還會有少數 paper。

你現在的任務還不是決定你自己具體要解決什麼問題,而是先了解這個小領域的研究歷史,目標是從整個研究小史中看出大家為了理解這一問題都做過什麼努力,現在到達了一個什麼程度。只有在這個基礎上,你所提出的新想法,你所做的貢獻,才會“入流”,將來才會好發文章。

所以,你必須要從幾個關鍵詞開始,最後獲得大量文獻。而且希望所找到的這些文獻都是處於或圍繞著該領域研究歷史的主流的,而不是一些 trivial 的工作。以下是我的做法。

我的課題最初得到的關鍵詞就是“物理凝膠化”,再加上從專業上講,我是搞高分子的,凝膠又必定是高分子網絡 - 小分子溶劑的二元體系,因此我要找的文獻應該關於“高分子”、“溶液”和“物理凝膠化”。我一開始是在 Google.com 上搜索這幾個關鍵詞的。在此我先要講講我對搜索引擎的看法。

1

一般搜索引擎

很多同學用百度搜中文的東西,搜外文的東西也充其量用 Google.cn(谷歌)。但根據我的使用經驗,百度搜索技術十分差勁,或者說它對搜索結果進行了人為的調整,導致你無論搜索什麼,所出來的東西離你真正想要的相差很遠。Google.cn 的搜索技術雖然基於 Google,但由於中國審查和中國的營利模式的原因,其搜索結果也經過了人為的調整。在 Google.com 搜索中文和英文信息都令人滿意,絕不會像某些同學所想象的那樣,認為用英文的 Google.com 搜中文會有很多該搜到的搜不到 -- 反倒百度會如此。在大多數的電腦上,鍵入 www.google.com 後自動會轉入 www.google.cn(谷歌),需要在頁面下方點擊“Google.com in English”才會進入真正的 Google.com。使用英文的 Google.com 的另一個好處是,你能使用 Google 所開發的所有工具和功能,因為 Google 僅有部分工具進行了漢化並在 Google.cn(谷歌)上發佈。

2

搜索的技巧

關於 Google 搜索技巧的文章在網上有很多了,但是我看了都等於沒看。除了用空格隔開關鍵詞之外(大概是 and 的效果),我只懂用表示 or 的符號“|”,還有用雙引號表示精確對應。再就是點開 advanced options 了,裡面可以有更多的搜索選項。就算是這樣,我都懶得用這麼多技巧。

回到我自己的例子,我搜“physical gelation”,看看出來點什麼結果;然後再搜“polymer physical gelation”、“polymer solution physical gelation”等等,換變換著關鍵詞的組合,以刺激搜索引擎的智能,讓它儘量給你新的東西。在搜索結果中會直接出現一些科研文獻,甚至是 pdf。但是從 Google 上搜到的這些文獻往往是不太主流,但目前也只能先打開來看看了。通過看這些文獻的 Introduction 部分,你會:

  • 知道更加相關或準確的關鍵詞。然後回到 Google.com 搜出更加相關的 paper
  • 通過 Introduction 中的講述和引用,知道一些局部的研究歷史,並得到主流的文獻

不要急著看文獻的 Introduction 的具體介紹,先儘量得出些關鍵詞,窮盡 Google.com 所能得到的東西。最後其實關鍵詞也無非那幾個,在 Google 上,你已經無法獲得什麼新的東西了。這時,由於你畢竟瀏覽了好幾篇 paper 的 Intorduction,大概對本領域的以前研究有些模糊的印象。

3

科學研究工作的類型或地位

我又要暫時離開主線,單獨講講另一個問題。因為和僅僅在 Google 上瞎搜索不同,接下來你將會找到大量的文獻了,這時你需要對這些文獻有所取捨。因此,最好腦中要對科學研究工作的類型或地位有清晰的認識。武夷山老師的博客裡已經說過:

表現於理論,可以是提出新概念(可以是小概念)、發現新現象(可以是小現象)、引入新方法、構建新模型、改進舊模型,等等。表現在實證,可以是蒐集新數據、從一個新的角度或採用新的方法去分析新數據或老數據、根據分析結果提出理論建議。

以上引文我把最後四個字“政策建議”改為“理論建議”,因為我做的是基礎研究,無非是就是在理論與實驗之間倒騰。

4

Introduction+ 參考文獻

現在回到我的例子,經過不斷 Google,我已經搜到的一些 Paper。現在的任務就是按年代往前搜索文獻。現在,通過手頭上有的 Paper 的 Introduction 部分,會得到一些參考文獻,這些參考文獻的 Introdcution 又會提供更多的參考文獻。在一開始,這樣的搜尋方式會導致你的文獻數量以幾何方式增加。而且,儘管我清楚要進行取捨,但在我對這一領域還很模糊的情況下,我基本上沒有怎麼去“舍”。但是,還是有幾個原則要記住。

任何一篇文章的 Introduction 部分,都可以分成兩部分,第一部分就是吹大牛,第二部分就是具體到本文的方法、材料和元素的具體介紹。“吹大牛”部分所引用文獻一般都比較重要比較主流的文獻,但是第二部分在講具體方法具體材料時的所引用的文獻,就要看情況了。如果這篇文章所用的方法、材料等等是本領域經常用到的主流,那麼這部份所引用的文獻也是需要看的;如果這篇文章所用的方法、材料等等在本領域來說是很次要的,完全是補充性的,甚至是沒事找事的,那你就不用管它引用的參考文獻了。不過,也許在一開始你連這個問題都判斷不了,那就只能照單全收了。

這一階段的目標是儘量找到最老、最原始的那些研究。因此如果你想減輕你的負擔的話,可以在年份上跳躍一下。比如,如果一下子找到了 20 年前的一篇 paper,那麼這十年間的 paper 的 introduction 就可以都不看了,直接從 20 年前的那篇 paper 的 introduction 開始,重新向更早擴展。這十年間你所跳過的 paper,將來有機會找到的。

5

ISI Web of Knowledge

ISI Web of Knowledge 的用處有兩個方面:

在上面按 topic 搜你的關鍵詞,可以找到更多相關的文獻,其意義上面已意講過了,前面講過的搜索的技巧此處也適用的。

在上面搜某一特定的 paper,可以查到這篇文章發表之後的被引用情況。

要在 ISI 上查某特定的文章,可以直接按 title 搜標題,也可以通過期刊名、發表年份和作者結合起來找。值得注意的是,ISI 收錄的文章是不全的,例如 Macromolecules 只從九十年代之後開始收,而且每一期都不是全收。所以就算搜索得當,也不一定就能搜出實際存在的文獻,尤其是比較七十年代以前的。剛才我說過,通過 paper 的 introduction 引用文獻,不斷在年份上進行回溯,目的是為了找出整個研究歷史主線上的研究工作。其基本意圖就是搜出少數年代久,但是比較重要比較核心的經典 paper。然後,就要通過 ISI,找到引用這些主流而且經典 paper 的文獻記錄,並進一步查找引用這篇老文獻的文獻列表。根據這些文獻的標題,你就可以選出一些比較主流的文章來,這樣就能從老到新地回到研究歷史的主線上來。但是由於剛才說了 ISI 不收很老的文章,所以你不要等到回溯到五六十年代之後才用 ISI,而是到了七八時年代就先用 ISI 查找一下引用情況,部分回到主線中來,然後再利用從 ISI 找到的這些比較接近主線的文章往早期回溯,找到更加主流的經典 paper。

有一些比較老的文獻如果 ISI 沒有收,那就可以看看該文獻的期刊所屬的出版商網站上的這篇文章的頁面。現有一些大的出版商網站,每一篇文章的頁面都會自動顯示被引文章。

6

要多次反覆

所謂要多次反覆,就是說你查到一定的文獻,就可以先認真閱讀了。閱讀的時候按年份從早到晚的順序。在閱讀的過程中,你會:

  • 對本領域的基本問題更加清晰
  • 發現本領域內一些貢獻比較大的牛人
  • 發現很多該找到的文獻之前沒找到

這樣,不管是哪個原因,你都會覺得你又必要再花時間去搜集文獻,走回剛才所講的步驟。一直到最後,你就會發現這個領域從最開始一直到現在的整個脈絡的文獻你基本上都有了。


分享到:


相關文章: