wordcloud是目前R語言中非常棒的詞雲程序包,它滿足了數據可視化基本的需求。 wordcloud2的出現,可以使詞雲可視化更加靈活方便,與wordcloud相比,wordcloud2能更有效的利用詞與詞的間隔來插入數據,更可以根據圖片或者文字來繪製定製化的詞雲。
先簡單看一個例子,對比一下二者可視化的效果:
> library(wordcloud2)
> wordcloud2(demoFreq)
> library(wordcloud)
> wordcloud(demoFreq$word, demoFreq$freq)
wordcloud2 程序包有兩個基本的函數:
wordcloud2: 提供基本的詞雲功能;
letterCloud: 可以使用選定的詞繪製詞雲 。
具體使用說明,可通過help(wordcloud2)、help(letterCloud)命令查看幫助說明,下面通過介紹三種模式,簡要說明wordcloud2程序包的使用。
基本模式
我們可以把準備好的數據框 (第一列詞名,第二列詞頻) 放入wordcloud2 函數,wordcloud2 會自動處理,生成一個動態的頁面。下面我們以wordCloud2程序包自帶的數據集demoFreqC為例,做一個基本模式下的詞雲可視化處理:
> data("demoFreqC")
>#計算詞頻
> head(demoFreqC)
V2 V1
1 數據 2304
3 統計 1413
4 用戶 855
5 模型 846
7 分析 773
8 數據分析 750
>#詞雲可視化
> wordcloud2(demoFreqC, color = "random-light", backgroundColor = "white")
自定義模式
自定義模式允許用戶去設定一個字符,然後根據這個字符,生成一個形狀相同的詞雲。自定義模式使用lettercloud()函數來完成。例如,我們要生成一個字符R的詞雲,顏色隨機高亮,背景黑色,大小0.3。數據集為"chiffon.csv",演示代碼如下:
> dat
> dat
> letterCloud(dat,word = "R", color = "random-light", backgroundColor = "black",size = 0.3)
極客模式
很多時候字母什麼的並不能滿足我們的需求,有時候需要根據自己的圖片來生成一個定義好形狀的詞雲,wordcloud2 裡面也是支持的,只需要給 wordcloud2 傳一個圖片路徑就好了。
wordcloud2 函數支持輸入自定義圖片來作為詞雲的背景形狀,需要注意的是自己定義圖片的時候需要 “黑白” 的顏色作為詞雲的形狀輸入,我們使用一張鋼鐵俠的剪影圖片作為詞雲的背景形狀,演示代碼如下:
> wordcloud2(demoFreq, figPath = './ironman.png', size = 1.5,color = "black")
閱讀更多 數據分析和挖掘 的文章