R語言數據挖掘實踐——文本挖掘環境搭建

R語言數據挖掘實踐——文本挖掘環境搭建

在使用R語言進行文本挖掘之前,我們先安裝一些常用的文本挖掘程序包。

> install.packages("tm")

> install.packages("RJava")

> install.packages("Rwordseg")

> install.packages("RColorBrewer")

> install.packages("wordcloud")

> install.packages("tmcn")

我們主要使用的程序包是Rwordseg,這個安裝包需要依賴rJava包,rJava需要本機中有安裝Java。

下載地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

或者直接搜索安裝JDK,技術人員應該都懂,非技術人員可能會搞錯,不然沒辦法使用Rwordseg。下載好JDK中,我們需要在“控制面板-系統-高級系統設置-環境變量”中配置好相關的環境變量,如下圖所示:

R語言數據挖掘實踐——文本挖掘環境搭建

在cmd命令行環境下,我們可以輸入“java -version”來檢測環境變量的配置是否正確,如果能打印出Java的相關信息,則說明配置正確,那麼我們就可以開始安裝rJava程序包了。

R語言數據挖掘實踐——文本挖掘環境搭建

安裝完rJava包之後,就可以開始安裝文本分詞包Rwordseg,由於Rwordseg只能在R3.0.2版本上安裝成功,並且Rwordseg放在Rforge而非CRAN上,因此如果直接install.packages,基本都會失敗告終。正確方法是下載源碼,本地安裝。

我們先從官網下載安裝包,下載地址:https://r-forge.r-project.org/R/?group_id=1054

R語言數據挖掘實踐——文本挖掘環境搭建

然後,我們使用RStudio的Tools工具欄,以zip的形式手工導入已經下載好的Rwordseg包進行安裝。

R語言數據挖掘實踐——文本挖掘環境搭建

通過以上幾個步驟,初步完成了文本挖掘相關包的安裝和環境搭建工作,下一步:開始使用安裝包進行文本挖掘!


分享到:


相關文章: