R语言数据挖掘实践——wordcloud2词云可视化

wordcloud是目前R语言中非常棒的词云程序包,它满足了数据可视化基本的需求。 wordcloud2的出现,可以使词云可视化更加灵活方便,与wordcloud相比,wordcloud2能更有效的利用词与词的间隔来插入数据,更可以根据图片或者文字来绘制定制化的词云。

先简单看一个例子,对比一下二者可视化的效果:

> library(wordcloud2)

> wordcloud2(demoFreq)

> library(wordcloud)

> wordcloud(demoFreq$word, demoFreq$freq)

R语言数据挖掘实践——wordcloud2词云可视化

wordcloud2 程序包有两个基本的函数:

  • wordcloud2: 提供基本的词云功能;

  • letterCloud: 可以使用选定的词绘制词云 。

具体使用说明,可通过help(wordcloud2)、help(letterCloud)命令查看帮助说明,下面通过介绍三种模式,简要说明wordcloud2程序包的使用。

基本模式

我们可以把准备好的数据框 (第一列词名,第二列词频) 放入wordcloud2 函数,wordcloud2 会自动处理,生成一个动态的页面。下面我们以wordCloud2程序包自带的数据集demoFreqC为例,做一个基本模式下的词云可视化处理:

> data("demoFreqC")

>#计算词频

> head(demoFreqC)

V2 V1

1 数据 2304

3 统计 1413

4 用户 855

5 模型 846

7 分析 773

8 数据分析 750

>#词云可视化

> wordcloud2(demoFreqC, color = "random-light", backgroundColor = "white")

R语言数据挖掘实践——wordcloud2词云可视化

自定义模式

自定义模式允许用户去设定一个字符,然后根据这个字符,生成一个形状相同的词云。自定义模式使用lettercloud()函数来完成。例如,我们要生成一个字符R的词云,颜色随机高亮,背景黑色,大小0.3。数据集为"chiffon.csv",演示代码如下:

> dat

> dat

> letterCloud(dat,word = "R", color = "random-light", backgroundColor = "black",size = 0.3)

R语言数据挖掘实践——wordcloud2词云可视化

极客模式

很多时候字母什么的并不能满足我们的需求,有时候需要根据自己的图片来生成一个定义好形状的词云,wordcloud2 里面也是支持的,只需要给 wordcloud2 传一个图片路径就好了。

wordcloud2 函数支持输入自定义图片来作为词云的背景形状,需要注意的是自己定义图片的时候需要 “黑白” 的颜色作为词云的形状输入,我们使用一张钢铁侠的剪影图片作为词云的背景形状,演示代码如下:

> wordcloud2(demoFreq, figPath = './ironman.png', size = 1.5,color = "black")

R语言数据挖掘实践——wordcloud2词云可视化


分享到:


相關文章: