本文基於公眾號“玉樹芝蘭”《如何用R快速瞭解科研領域》撰寫,感謝老師的分享。
BiblioShiny官方網址:https://bibliometrix.org/
BiblioShiny
Biblioshiny分為:
三個不同級別指標的分析和圖表:
-來源
-作者
-文獻
知識的三個結構(K結構):
-概念結構 :主題和趨勢
-知識結構 :作者對該領域的影響力
-社會結構:作者、機構、國家如何彼此影響
簡單來說,這款工具可以對某一科研領域的作者、期刊、文獻計量分析,無需敲打代碼,就可以對該科研領域有一個簡單的認識。
接下來的篇幅,主要圍繞BiblioShiny各個模塊介紹,大家可以根據需求進行相應分析。
數據
數據從Web of Science下載,選擇數據庫“Web of Science核心合集”,檢索式主題“information serendipit*”or 主題“information encounter*”,時間跨度“所有年份”。
對結果精煉,文獻類型“ARTICLE”。
避免文獻相關性過低,通過觀察,選擇前1000條。
導出格式選擇“其他文件格式”,記錄來源“1至500”,記錄內容“全紀錄與引用的參考文獻”,文件格式“BibTex”。下一次導出,記錄來源改變“501-1000”。將下載的文件保存為Archive.zip。
安裝
通過官網安裝R與Rstudio,安裝後,在Rstudio中執行以下命令。
如果安裝包過程中出現問題,有可能是鏡像問題。
選擇“Tools”中“Global Options”,Packages-CRAN Mirrors-China(Beijing)-enter鍵。
安裝成功,會跳出如下頁面。
數據加載與過濾(Data&Filter)
選擇Data-Import or Load,Import raw file(s)-Web of Science(WoS/WoK)-BibTex,將下載的wos數據上傳,可以選擇將bibliometrix文件另存為excel/R Data Format格式。
過濾:可以根據文獻類型、出版年份、被引次數、來源。
數據集
Main Information(部分)
Annual Scientific Production:每年發文量
Average Citations per Year:每年平均引用次數
Three-Fields Plot:可以更改不同字段、調整數目,繪製可視化圖,記得Apply!
Sources(來源)
Most Relevant Sources:與該主題相關的期刊
Most Local Cited Sources:高被引期刊(當前文獻集)
Bradford’s law:根據布拉德福定律劃分出核心區
Source Impact:期刊影響因子
Source Dynamics:期刊出現次數
Authors(作者)
Most Relevant Authors:最高產作者
其中,Fractionalized Frequency是作者對於論文的貢獻率。
Author’s Production over Time:高產作者近期發文
Lotka’s law:洛特卡定律(核心作者)
Author Impact:作者影響因子
Most Relevant Affiliations:最高產機構
Corresponding Author’s Country:合著作者的國籍
其中MCP表示與其他國家作者合著論文的數量;SCP表示同國籍作者合著論文數量。
MCP_Ratio可以看出國際合作的比率高低。
Country Scientific Production:各個國家發文量
Most Cited Countries:高被引國家以及被引次數
Document(文獻)
Most Global Cited Documents:在web of science中高被引文獻
Most Local Cited Documents:在當前數據集中高被引文獻
Most Local Cited References:在當前數據集中高被引的參考文獻
Reference Spectroscopy:每年參考文獻的數量
Most Frequent Words:高頻詞
根據需求,更改字段。
Keywords Plus:WoS增加的關鍵詞是和原文章相關的關鍵詞,但是作者本人沒有添加,為了增加文章在相關專題下的命中率。
WordCloud:詞雲
TreeMap:樹圖
Word Dynamics:詞出現次數,展示詞變化趨勢
Trend Topics:根據當年詞出現頻次推測熱點話題
Conceptual Structure(概念結構)
Co-occurrence Network:共現網絡
可以選擇對應詞,確定與其相關聯的其他詞
Thematic Map:主題地圖
橫軸:中心度;縱軸:密度
第一象限(右上角):motor themes,既重要又有良好發展;
第二象限(左上角):highly developed and isolated themes,已有良好發展,但是對於當前領域不重要;
第三象限(左下角):emerging or declining themes,邊緣主題,也沒有好的發展,可能剛剛湧現,也許即將消失;
第四象限(右下角):basic and transversal themes,對領域很重要,但是未獲得良好發展。一般是指基礎概念。
Thematic Evolution:主題演化
Factorial Analysis:析因分析
三種方法:
Correspondence Analysis:對應分析
Multiple Correspondence Analysis:多重對應分析
Multidimensional Scaling:多維標度法
word map(詞彙地圖)將研究領域劃分為幾個類別
最具貢獻論文(Most Contributing Papers)
Contributing:彙總的信息中每篇論文的權重
在wos被引次數最高的文獻(Most Cited Papers)
Intellectual Structure(知識結構)
Co-citation Network:同被引網絡
Historiograph:瞭解數據集中重要性較高文獻
Table列表中,LCS表示當前數據集中,文獻被引次數,也就是文獻在該領域的重要程度;GCS表示Web of Science 中,文獻被引次數。
Social Structure(社會結構)
Collaboration Network:合作網絡(作者、機構、國家)
Collaboration WorldMap
以上對biblioshiny中的指標解讀可能會存在不足,歡迎大家批評指正!
繪製圖是第一步,解讀圖至關重要,合理應用計量指標以及設置參數,可以快速瞭解某一科研領域。
閱讀更多 質數數數數 的文章