下面以建立手機用戶評論特徵詞庫為例介紹它的用法,這些文本來自於電商網站,是消費者對手機產品的評論。
1、準備好要分詞的文件
首先要準備好手機商品的用戶評論數據,把評論數據整理到Excel或者txt/word/pdf等格式的文件裡;
2、往分詞工具裡導入數據
有兩種導入數據的方式
方式一:在電腦的瀏覽器上操作
在電腦上訪問分詞打標工具https://www.gooseeker.com/tagtool2,然後選擇文件導入進去;
方式二:在手機上操作
3、選擇特徵詞
自動分詞後,在網頁版上篩選詞語,選出手機的品牌詞、特徵詞,這是按詞頻大小排序的,並且是過濾掉英文、數字、單字、網址等,選出的就是高頻詞了;
4、把結果通過小程序分享給別人
5、下載數據表
最後,給大家分享用這次整理到的手機用戶評論特徵詞做成的詞雲圖,如下:
閱讀更多 語義網絡爬蟲 的文章