基於病毒學的情報分析數據集

浙江大學信息資源分析與應用中心結合中國工程院知識中心“工程科技機構與專家庫”項目的數據建設成果,通過數據蒐集與整理完成了基於病毒學的文獻數據集以供學者分析與研究,數據集構建及說明如下。

一、病毒學關鍵詞獲取

檢索Journal of General Virology、Journal of Virology、Virology、Advances in Experimental Medicine and Biology 、Emerging Infectious Diseases 五本病毒學及傳染病學領域期刊2003-2020年文獻,文獻類型僅包含article和review,分析了52144篇文獻數據共37876個關鍵詞,用Bibexcel軟件將關鍵詞分行,統計詞頻,取詞頻大於等於13的關鍵詞,篩選獲得976個高頻詞,並生成共現關鍵詞對,取共現次數大於等於5的關鍵詞對共1046對。

二、數據集構建

以1046對關鍵詞對為檢索式,在Web of Science數據庫275種醫學權威期刊(期刊列表見附件)中檢索標題、關鍵詞和摘要字段,限定條件為2003-2018年文獻類型為Article或Review的文獻,命中文獻322094篇。

三、數據說明

本中心對以上322094篇文獻元數據進行了作者、機構、國別等信息的拆分,共獲取1839840條作者機構信息。

基於上述信息,我們發現2003年SARS之後,全球病毒學研究有一些統計學上的表現,其中發文排名前十的學者見表1。

基於病毒學的情報分析數據集

利用荷蘭萊頓大學科技研究中心(The Centre for Science and Technology Studies, CWTS)的van Eck 和Waltman於2009年開發的一款基於JAVA的免費軟件VOSviewer,發文排名第一的作者“Haynes, Barton F.”的合作者網絡如圖1所示(注:並未顯示所有合作者,VOSviewer對顯示節點數要求在1000個左右)。


基於病毒學的情報分析數據集

圖1 Haynes, Barton F.的合作者網絡

同時,發文排名第三的作者“Mascola, John R.”的合作者網絡如圖2所示,可以發現他和發文排名第一的“Haynes, Barton F.”、發文排名第二的“Montefiori, David C.”都有密切合作。


基於病毒學的情報分析數據集

圖2 Mascola, John R.的合作者網絡

病毒學研究前10的研究機構見表2,可視化見圖3。


基於病毒學的情報分析數據集


基於病毒學的情報分析數據集

圖3 全球病毒學機構合作網絡分析

由上圖可知,發文數量排名第一的哈佛大學與牛津大學、東京大學、墨爾本大學、中科院等機構有較為緊密的合作研究關係。

全球病毒學研究的主要學者和機構分佈國家列於表3。

基於病毒學的情報分析數據集

其中,中國是發文排名第三的國家,其跨國合作網絡分析如圖4所示。

基於病毒學的情報分析數據集

圖4 中國的跨國合作網絡分析

上述數據集若機構與學者有需要進一步分析研究,可與知識中心機構與專家庫課題組陸老師聯繫獲取([email protected])。

浙江大學信息資源分析與應用中心

中國工程院知識中心中國工程科技機構與專家庫課題組


分享到:


相關文章: