懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器


懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器


此係列文章收錄在公眾號中:數據大宇宙 > 數據處理 > E-pd

轉發本文並私信我"python",即可獲得Python資料以及更多系列文章(持續更新的)

經常聽別人說 Python 在數據領域有多厲害,結果學了很長時間,連數據處理都麻煩得要死。後來才發現,原來不是 Python 數據處理厲害,而是他有數據分析神器—— pandas

前言

Excel 的表格是以靈活為主,也因此造就各種數據災難現場。今天來看看怎麼填補有意義的空白單元格,並且對應的 pandas 方法。


帶"坑"的表格

如下一份銷售人員記錄表:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 你作為一名有素質的數據人員,第一時間就覺得這表格怪怪的,怎麼有這麼多蘿蔔坑?!
  • 當你詢問表格製作的同事,他卻說,這挺好的,條理很分明,空格體現時尚簡約!

好吧,幸好你已經長時間接受這種非人的鍛鍊,打開 Excel,定位 + 等號 + 批量寫入,輕鬆解決:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 內功心法:選區 -> 定位 -> 空值 -> 輸入公式 -> 引用上方一個單元格 -> Ctrl + Enter

你為了展示 Excel 功力,全程使用快捷鍵,一切盡在不知不覺中解決問題:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 內功心法:選區 -> F5 -> Alt+S -> Alt+K -> 回車 -> 引用上方一個單元格 -> Ctrl + Enter

啪!!!!白日夢做完了,你的同事一言不合給你扔了 n 個同樣"時尚簡約"的表格。那不是要手殘了?!

幸好,你想起來昨晚看到這一篇文章剛好說到是如何用 pandas 解決


pandas 中的填"坑"

對於 pandas 來說,Excel 中的這些空單元格,加載後全是 nan:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 這麼看來一點都不時尚了

要填補這些眼花繚亂的 nan,只需要一個方法:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 行2:表格.fillna() 填"坑"操作,但是怎麼填是有講究的,參數 method 就是告訴他怎麼填
  • method 參數有很多可選值: {'backfill', 'bfill', 'pad', 'ffill', None}
  • 用 ffill 相當於之前的 Excel 操作,獲取前面的值(相當於 Excel 操作中,輸入等號後,引用公式上方的單元格地址)

但是,調用一個方法還要寫上這麼多字母,手殘黨怎麼辦?pandas 不會讓你失望:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

別小看 pandas 這麼一個小方法,他可以做幾乎應對所有填"坑"的場景,比如,直接填個值,大聲告訴所有人,"我是空白,我驕傲!":

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

當然,與普通的表格方法差不多,能通過 axis 參數控制填充方向:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 呃,雖然出來的結果不知所云,如果你把手機橫過來看(行列互換),說不定能看懂

你會說,填坑到底為了啥?

其實很多時候這些坑來源於合併單元格,比如原來的表格是這樣子:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

  • 你要統計每個人的總銷量

看完這文章,你不就非常容易搞定事情了嗎:

懂Excel輕鬆入門Python數據分析包pandas(30):填坑利器

需要源碼的小夥伴請轉發本文並私信我"python"

如果希望從零開始學習 pandas ,那麼可以看看我的 pandas 專欄。


分享到:


相關文章: