一、安裝jieba庫
按照教材上的直接在命令行模式輸入pip或pip3,結果提示‘pip’不是內部或外部命令。。。
經過某度,在python安裝目錄script文件夾沒有pip3.exe這個文件。在命令行輸入:python -m ensurepip 將pip.exe文件下載下來
(如果有pip.exe文件,直接用cd命令到文件夾運行pip命令即可)
Pip安裝成功後就是安裝jieba庫了,在cmd中輸入pip3.install.jieba,從網上下載下來安裝,庫不大,好像7兆多,但是網速太慢了,平均一分鐘11KB,還是用了5分鐘左右才下載安裝完成。
二、做第1題:使用jieba.cut( )對“Python是最有意思的編程語言”進行分詞,輸出結果,並將迭代器轉換為列表類型
1、審題發現jieba.cut( )命令和教材上的jieba.lcut( )不一樣,後知道前者返回的結果是一個可迭代的generator對象,可以進行遍歷或者轉換為列表進行處理。後者直接返回List;
可迭代的generator對象?迭代器?都沒有聽過,再次某度,看了也是一知半解,先放在這裡,空了又再深入學習吧:https://www.jianshu.com/p/4c8e4fb4ef37#
2、先將字符串賦給變量,注意is不要小寫。
3、jieba.cut( )命令輸出的是迭代器,用list命令就可以轉換成列表類型了。
三、做第2題:使用jieba.cut( )對“今天晚上我吃了意大利麵“進行分詞,輸出結果,並使“意大利麵”作為一個詞出現在結果中。
1、向分詞詞典中增加新詞w的指令:jieba.add_word(w)。
2、在導入結巴庫後,直接添加這樣一行指令即可。
3、迭代器也可以用循環語句打印出來,不用轉換成列表:for i in Is:print(i)