R語言數據挖掘實踐——wordcloud2詞雲可視化

wordcloud是目前R語言中非常棒的詞雲程序包,它滿足了數據可視化基本的需求。 wordcloud2的出現,可以使詞雲可視化更加靈活方便,與wordcloud相比,wordcloud2能更有效的利用詞與詞的間隔來插入數據,更可以根據圖片或者文字來繪製定製化的詞雲。

先簡單看一個例子,對比一下二者可視化的效果:

> library(wordcloud2)

> wordcloud2(demoFreq)

> library(wordcloud)

> wordcloud(demoFreq$word, demoFreq$freq)

R語言數據挖掘實踐——wordcloud2詞雲可視化

wordcloud2 程序包有兩個基本的函數:

  • wordcloud2: 提供基本的詞雲功能;

  • letterCloud: 可以使用選定的詞繪製詞雲 。

具體使用說明,可通過help(wordcloud2)、help(letterCloud)命令查看幫助說明,下面通過介紹三種模式,簡要說明wordcloud2程序包的使用。

基本模式

我們可以把準備好的數據框 (第一列詞名,第二列詞頻) 放入wordcloud2 函數,wordcloud2 會自動處理,生成一個動態的頁面。下面我們以wordCloud2程序包自帶的數據集demoFreqC為例,做一個基本模式下的詞雲可視化處理:

> data("demoFreqC")

>#計算詞頻

> head(demoFreqC)

V2 V1

1 數據 2304

3 統計 1413

4 用戶 855

5 模型 846

7 分析 773

8 數據分析 750

>#詞雲可視化

> wordcloud2(demoFreqC, color = "random-light", backgroundColor = "white")

R語言數據挖掘實踐——wordcloud2詞雲可視化

自定義模式

自定義模式允許用戶去設定一個字符,然後根據這個字符,生成一個形狀相同的詞雲。自定義模式使用lettercloud()函數來完成。例如,我們要生成一個字符R的詞雲,顏色隨機高亮,背景黑色,大小0.3。數據集為"chiffon.csv",演示代碼如下:

> dat

> dat

> letterCloud(dat,word = "R", color = "random-light", backgroundColor = "black",size = 0.3)

R語言數據挖掘實踐——wordcloud2詞雲可視化

極客模式

很多時候字母什麼的並不能滿足我們的需求,有時候需要根據自己的圖片來生成一個定義好形狀的詞雲,wordcloud2 裡面也是支持的,只需要給 wordcloud2 傳一個圖片路徑就好了。

wordcloud2 函數支持輸入自定義圖片來作為詞雲的背景形狀,需要注意的是自己定義圖片的時候需要 “黑白” 的顏色作為詞雲的形狀輸入,我們使用一張鋼鐵俠的剪影圖片作為詞雲的背景形狀,演示代碼如下:

> wordcloud2(demoFreq, figPath = './ironman.png', size = 1.5,color = "black")

R語言數據挖掘實踐——wordcloud2詞雲可視化


分享到:


相關文章: