勤勞的程序員們,這裡有 30 條使用 Python 時實用的建議和小技巧。你可以把讀這篇文章當做工作間隙的小憩,而且我保證你學到的東西會跟工作時一樣多。
1. 使用 Python3
如果你關注 Python 的話,應該會知道 Python 2 已經於今年(2020 年)1 月 1 日正式棄用了。這份教程的很多例子都是隻支持 Python 3 的,如果你還在用 Python 2.1,那也是時候與時俱進了。
2. 檢查所需的最低 Python 版本
你可以在代碼中先檢查一下你的 Python 版本,以免當前用戶的 Python 版本與你的腳本不適配。實現的代碼很簡單:
3. 使用 IPython
IPython 其實就是升級版的 shell,單單是自帶的自動補全功能就值得你使用它了。不過它的優勢不止這些,它那些如魔法般的內置命令行也讓是我愛使用它的原因。這些命令有:
如果你想了解更多的命令,可以參考這個網站:
https://ipython.readthedocs.io/en/stable/interactive/magics.html。
還有一個有用的功能就是調取之前的命令輸出,這裡的輸入和輸出其實都是對象。例如,你可以用 Out[3] 來調取第三條命令的輸出。
你可以用下面這條命令安裝 IPython:
<code>
pip3
install ipython/<code>4. 列表表達式
有了列表表達式,你就不再需要用 for loop 來生成一個 list 了。其基本語法是這樣的:
<code>[ expression for item in list if conditional ]/<code>
這就是一個生成包含一串數字的 list 的簡單例子。
在這條命令裡還可以使用表達式(expression),所以也可以做一些數學運算:
你甚至可以調用一個外部函數:
最後,你也可以在生成 list 時用 if 語句進行篩選。下面這個例子中,我們只保留了能被 2 整除的值:
5. 檢查你的對象佔用了多少內存
你可以使用 sys.getsizeof() 來查看你創建的對象佔用的內存大小:
哇,等一下,為什麼這麼大的 list 只有 48 字節?
這是因為 range 函數只返回了一個類似 list 的類。由此可見,相較於直接使用 list,使用 range 能節省很多空間:
6. 返回多個值
Python 的函數可以同時返回多個值,也並不需要使用 dictionary,list 或是類這樣的數據結構。它的工作機制是這樣的
這種方式在返回值的數量很少時是可以的,但是如果返回值超過 3 個,那它們就該被放到一個(數據)類中了。
7. 使用數據類
Python 從 3.7 開始提供數據類功能。這種功能與常規的類以及其他類似的功能(返回多個值的函數以及 dictionary)相比較,有以下優勢:
下面展示了一個實用的數據類例子:
想更深入的瞭解數據類,可以參考:https://realpython.com/python-data-classes/
8. 在位置不變的情況下交換變量
一個小技巧就可以減少很多行代碼:
9. 合併 dictionary(Python 3.5+)
從 Python 3.5 開始,dictionary 的合併變得更容易了:
如果有重複的 key,那麼第一個詞典的這個 key 對應的值會被覆蓋掉。
10. 把字符串變成標題形式
這只是 Python 中的寶藏之一:
11. 把字符串分割成 list
你可以把一個字符串分割成一個 list 的字符串。下面的例子中,我們是按照空格分割字符串的:
12. 將一個字符串列表變成一個字符串
把上一個小技巧反過來,我們也可以把一個 list 變成一個字符串,並在每個詞中間插入空格:
你可能在想為什麼不用
<code>mylist.
join
(" "
)/<code>好問題!
這是因為 String.join() 可以連接任何可迭代對象,不只是列表。在 String 中用這個函數可以防止這些操作發生在我們不想他發生的地方。
13. Emoji
這個功能有些人喜歡,有些人則很抗拒,因人而異。嚴格來說,這個功能主要好處就是在分析社交數據時可以更加方便。
首先,你要安裝 emoji 模塊:
<code>
pip3
install emoji/<code>安裝完後,你可以像下面這樣使用這個模塊:
想要更深入的瞭解 emoji 模塊,可以參考:https://pypi.org/project/emoji/。
14. list 切片
list 切片的基本使用形式如下:
<code>a[
start
:stop
:step]/<code>Start, Stop 和 Step 都是可選參數。如果你沒有定義,它們就會按照如下規則分配默認值:
15. 翻轉字符串和 list
你可以用剛剛提到的切片操作來翻轉字符串和 list。把 step 設置成-1,就成完成翻轉操作:
16. 展示小貓的圖片
我終於還是發現了一個可以在我文章中提到小貓的機會!當然,你也可能是用這個功能來展示其他的圖。首先,你要安裝 Pillow,這是 Python Image 庫的一個分支:
<code>
pip3
install Pillow/<code>現在把這個圖像下載下來並命名為 kittens.jpg:
圖源:Pixabay 的 TheDigitalArtist
你可用下面這段 python 代碼來顯示圖像。
或者你可以直接在 IPython 上做這件事。
Pillow 能做的可不止這些。它可以對圖片進行分析、裁剪、過濾、增強、變形等等。如果想要更深入的瞭解,可以去看一下它的文檔:
https://pillow.readthedocs.io/en/stable/
17. 使用 map()
Python 的內置函數之一就是 map()。map() 的語法如下:
所以你可以給它一個函數讓其執行,然後還要傳給它對應的參數。這個參數可以使任何可迭代對象。下面的例子裡我用了 list:
快去看看你的代碼,是不是有的地方可以用 map() 而不是 loop!
18. 從 list 或是 string 中獲取 unique 元素
你可以用 set() 來獲取 list 或是類似於 list 的對象的 unique 元素,結果返回為一個 set。
19. 找到高頻值
在 list 或字符創中獲取高頻值:
所以這一行代碼所做的事就是先找到所有的 unique 值({1, 2, 3, 4}),然後 max 就會對這四個值分別進行 list.count 操作,並返回最大值。
20. 創建進度條
你可以創建你自己的進度條,也是很有意思的。但是直接使用 progress 包會快很多:
<code>
pip3
install progress/<code>現在你可以毫不費力的創建一個進度條了:
下面這個動畫展示了所有可能的進度條類型:
圖源:Giotgos Verigakis, https://pypi.org/project/progress/
21. 在交互 shell 中使用「_」
你可以用下劃線來獲得上一條命令的輸入,在 IPython 中是這樣的:
<code>
In
[1]
: 3 * 3Out
[1]
: 9In
[2]
: _ + 3Out
[2]
: 12/<code>Python shell 中這條命令也可以用。IPython shell 中你也可以用 Out[n] 來獲得 In[n] 的輸出。比如說,在上面的例子中,Out[1] 就會返回 9。
22. 快速創建一個網頁服務器
你可以快速創建一個網頁服務器,並將當前的路徑作為內容:
<code>
python3
-m
http
.server
/<code>如果你想跟你的同事分享一些東西,或者測試一些簡單的 HTML 網站,那這條命令就很有用了。
23. 多行字符串
儘管你可以在代碼中用三重引號(“ “ “ ” ” ”)來存儲多行字符串,但這並不是理想的方法。你在三重引號間的所有內容都變成了字符串,如下圖所示,連格式符都變成了字符串。
我比較傾向於使用第二種方式。這種方式可以把很多行合併到一起,同時你的代碼格式也會很好。這個方法唯一的缺點就是你要明確定義換行的位置。
24. 條件賦值的三元運算符
這是那些讓你代碼在保證可讀性的情況下更簡潔的方法之一:
<code>
[on_true]
if
[expression]
else
[on_false]
/<code>實例如下:
<code>
x
="Success!"
if (y ==2
) else"Failed!"
/<code>25. 統計出現數
你可以使用 collection 庫來獲得 list 中各個 unique 值的計數,並返回成一個 dictionary:
26. 比較符鏈(chaining of comparison operators)
Python 裡,你可以把比較符連接成一條鏈,這樣代碼會更有可讀性,而且更簡潔。
27. 加一些色彩
Colorama 中 Jonathan Hartley 的截屏
使用 Colorama,你可以在你的終端上添加點顏色。
28. 日期計算
python-dateutil 模塊對標準的 datatime 模塊做了很大的擴充。先下載一下這個模塊:
<code>
pip3
install python-dateutil/<code>你可以用這個庫做很多很酷的事情。我只會給你們介紹我發現的很有用的一個例子:日誌文件中日期的模糊解析等。
記住一點:基本的 Python 日期函數對一些問題束手無策的時候,這時 python-deteutil 就能發揮作用。
29. 整除
圖源:公共源 - Torindkflt
Python 2 中,除號(/)默認為整除,除非其中一個被操作數是浮點數。所以你會得到這樣的結果:
<code>
5
/
2
=
2
5
/
2.0
=
2.5
/<code>在 Python 3 中,除號的結果默認為浮點數,而//則成為了整除的符號,所以這個時候結果變成了:
<code>
Python
3
5
/
2
=
2.5
5
//
2
=
2
/<code>如果想要深入瞭解這一改變,請參考:https://www.python.org/dev/peps/pep-0238/。
30. 使用 chardet 檢測 Charset
你可以使用 chardet 模塊來檢測一個文件的 charset。當你在分析大量的文本時,這個模塊就會變得很有用。你可以用下面這條命令下載它:
<code>
pip
install chardet/<code>你現在會有一個命令行工具——chardetect,這個工具的使用方式是:
<code>
chardetect
somefile
.txt
somefile
.txt
:ascii
with
confidence
1.0
/<code>