全文共2115字,預計學習時長
7分鐘瞭解如何運用Python的某些數據對象,有利於保持井然有序的狀態,避免在處理數據科學項目中的大量數據時出錯。
在數據科學項目中,有時想跟蹤數據信息,或者希望靈活、快速、輕鬆地更新數據的全新輸入。
為此,小芯整理這篇文章。在本文中,你將學會:
· 在執行loop命令時,跟蹤索引
· 更新全新的dictionaryitems函
· 使用可重用對象記錄新信息
我們將從這些問題入手,詳細介紹如何使用Python工具解決問題。
希望這種方法能有助於這些工具在代碼中應用位置的可視化。
1、一邊執行Loop命令,一邊跟蹤
假設有一張好友姓名列表。既要遍歷列表,又要跟蹤計數。該怎麼做?使用enumerate即可。
<code>>>>friends = ['Ben', 'Kate', 'Thinh']/<code>
<code>>>> for i, item in enumerate(friends):/<code>
<code>>>> print(f'{i}: {item}')/<code>
<code>0: Ben/<code>
<code>1: Kate/<code>
<code>2: Thinh/<code>
或者簡單運用dictionarycomprehension
<code>>>>{i: friends[i] for i in range(len(friends))}/<code>
<code>{0: 'Ben', 1: 'Kate', 2: 'Thinh'}/<code>
2、更新DictionaryItems函數:
假如正在使用dictionary函數以跟蹤首句中的單詞及字數。
<code>sent1 ={'love': 1, 'hate': 3/<code>
但進行到第二句時,你想要用新語句更新先前的dictionary函數。
<code>sent2 = {'love':2, 'flower': 1}/<code>
更新的單詞包如下:
<code>{'love':3, 'hate': 3, 'flower': 1}/<code>
該怎麼做?要是有些工具能助你輕鬆完成,豈不是很好?如果正好需要這類工具,collections.Counter正中下懷。collections.Counter 這一類允許集合中多個元素的存在
<code>fromcollections import Counter/<code>
<code>bag_words = Counter()sent1 = {'love': 1, 'hate': 3}bag_words.update(sent1)sent2= {'love': 2, 'flower': 1}bag_words.update(sent2)bag_words/<code>
結果:
<code>Counter({'love':3, 'hate': 3, 'flower': 1})/<code>
太好了!現在,當你從其他語句中收集到更多信息時,便可以很容易地更新單詞包。可以運用len找出語句中有多少唯一單詞,
<code>>>>len(bag_words)/<code>
<code>3/<code>
或者,可以運用 sum計算語句中的單詞總量,
<code>>>>sum(bag_words.values())/<code>
<code>7/<code>
3、運用Namedtuple定義可重用對象
想跟蹤有關朋友的信息列表,為他們的生日做準備。由於暫時無可用信息,因此首先需要創建一個佔位符,以便之後在其中輸入信息。如果要記錄凱特(Kate) 的生日、最喜歡的食物、膚色以及是否內向,可以這樣做:
<code>>>>Kate = Friend('Feb', 'cake', 'pink', True)/<code>
此外,如果記不住她的生日,可以調用
<code>>>>Kate.birthday/<code>
<code>'Feb'/<code>
Python中的類對象可以實例化凱特,但是創建一個Friend類來保存簡單信息,很耗費時間。在此情況下,namedtuple是個不錯的選擇。namedtuple允許記錄定義一個可重用對象,確保使用正確的歸檔名稱
<code>fromcollections import namedtupleFriend = namedtuple('Friend' , 'birthday foodcolor introvert')Kate = Friend('Feb', 'cake', 'pink', True)Ben = Friend('Jan','fish', 'red', False)/<code>
顯示有關凱特的信息:
<code>>>>Kate/<code>
<code>Friend(birthday='Feb', food='cake', color='pink', introvert=True)/<code>
如果想知道本 (Ben) 是內向還是外向,可以調用
<code>>>>Ben.introvert/<code>
<code>False/<code>
使用 nametuples , 用戶可以輕鬆地重用同一對象以實例化新信息。
認真閱讀並實踐,你將學會運用enumerate、集合推導(set comprehension)、Counter 和namedtuple 來跟蹤信息。
希望本文能豐富數據科學工具包,為大家提供更多有用的知識。
我們一起分享AI學習與發展的乾貨
閱讀更多 讀芯術 的文章