第三方庫 jieba的練習(一)

一、安裝jieba庫

按照教材上的直接在命令行模式輸入pip或pip3,結果提示‘pip’不是內部或外部命令。。。

經過某度,在python安裝目錄script文件夾沒有pip3.exe這個文件。在命令行輸入:python -m ensurepip 將pip.exe文件下載下來

(如果有pip.exe文件,直接用cd命令到文件夾運行pip命令即可)

Pip安裝成功後就是安裝jieba庫了,在cmd中輸入pip3.install.jieba,從網上下載下來安裝,庫不大,好像7兆多,但是網速太慢了,平均一分鐘11KB,還是用了5分鐘左右才下載安裝完成。

二、做第1題:使用jieba.cut( )對“Python是最有意思的編程語言”進行分詞,輸出結果,並將迭代器轉換為列表類型

1、審題發現jieba.cut( )命令和教材上的jieba.lcut( )不一樣,後知道前者返回的結果是一個可迭代的generator對象,可以進行遍歷或者轉換為列表進行處理。後者直接返回List;

可迭代的generator對象?迭代器?都沒有聽過,再次某度,看了也是一知半解,先放在這裡,空了又再深入學習吧:https://www.jianshu.com/p/4c8e4fb4ef37#

2、先將字符串賦給變量,注意is不要小寫。

3、jieba.cut( )命令輸出的是迭代器,用list命令就可以轉換成列表類型了。

三、做第2題:使用jieba.cut( )對“今天晚上我吃了意大利麵“進行分詞,輸出結果,並使“意大利麵”作為一個詞出現在結果中。

1、向分詞詞典中增加新詞w的指令:jieba.add_word(w)。

2、在導入結巴庫後,直接添加這樣一行指令即可。

3、迭代器也可以用循環語句打印出來,不用轉換成列表:for i in Is:print(i)


分享到:


相關文章: