12.05 用 Python 在 Excel 中畫出蒙娜麗莎

用 Python 在 Excel 中畫出蒙娜麗莎

文 | 麥麥麥造 出處 | 掘金

之前看到過很多頭條,說哪國某人堅持了多少年自學使用 excel 畫畫,效果十分驚豔。對於他們的耐心我十分敬佩。但是作為一個程序員,自然也得挑戰一下自己。這種需求,我們十分鐘就可以完成!

用 Python 在 Excel 中画出蒙娜丽莎

基本思路

實現這個需求的基本思路是讀取這張圖片每一個像素的色彩值,然後給 excel 裡的每一個單元格填充上顏色。所以主要用到的是 <code>PIL/<code>、<code>openpyxl/<code>這兩個庫。

PIL 使用

<code>PIL/<code>是 Python 裡面做圖像處理的時候十分常用的一個庫,功能也是十分的強大,這裡只需要用到<code>PIL/<code>裡一小部分的功能。

  1. <code>from PIL import Image/<code>

  2. <code>img = Image.open(img_path)# 讀取圖片/<code>

  3. <code>width, height = img.size # 獲取圖片大小/<code>

  4. <code>r, g, b = img.getpixel((w -

    1, h -1))# 獲取像素色彩值/<code>

  5. <code>複製代碼/<code>

<code>Image.open/<code>是 PIL 裡面打開一張圖片的函數,支持多種圖片類型

<code>img_path/<code>是圖片路徑,可以是相對路徑,也可以是絕對路徑

<code>img.size/<code>是獲取圖片的<code>size/<code>屬性,包含圖片的寬和高

<code>img.getpixel/<code>是獲取圖片色彩值的函數,需傳入一個<code>tuple/<code>或<code>list/<code>,值為像素座標<code>xy/<code>

openpyxl 使用

<code>openpyxl/<code>幾乎是 Python 裡功能最全的操作 excel 文件的庫了,這裡也只需要用到它的一小部分功能。

  1. <code>import openpyxl/<code>

  2. <code>from openpyxl.styles import fills/<code>


  3. <code>workbook = openpyxl.Workbook/<code>

  4. <code>worksheet = workbook.active/<code>

  5. <code>cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)/<code>

  6. <code>workbook.save(out_file)/<code>

<code>openpyxl.Workbook/<code>新建一個 excel 文件

<code>workbook.active/<code>激活一個工作表

<code>cell.fill=fills.PatternFill(fill_type="solid",fgColor=hex_rgb)/<code>填充一個單元格,<code>fill_type="solid"/<code>是填充類型,<code>fgColor=hex_rgb/<code>是填充的顏色

<code>workbook.save/<code>保存文件,需傳入要保存的文件名

寫一段代碼

寫這一個畫圖的需求需要用到的核心就是上面介紹的 <code>PIL/<code>跟<code>openpyxl/<code>的幾種用法。但是在實際寫的時候,還會有一些其他問題,比如:

1、getpixel <code>獲取的顏色值是rgb十進制的,但/<code>fills.PatternFill<code>裡的/<code>fgColor`參數接收到的顏色值是十六進制的值。

這個問題其實就是十進制轉十六進制,很容易解決

  1. <code>def int_to_16(num):/<code>

  2. <code>num1 = hex(num).replace('0x','')/<code>

  3. <code>num2 = num1 if len(num1) > 1else'0'+ num1# 位數只有一位的時候在前面補零/<code>

  4. <code>return num2/<code>

2、excel 的單元格默認是長方形,修改為正方形才不會使圖片變形

  1. <code>if h ==

    1:/<code>

  2. <code>_w = cell.column/<code>

  3. <code>_h = cell.col_idx/<code>

  4. <code># 調整列寬/<code>

  5. <code>worksheet.column_dimensions[_w].width = 1/<code>


  6. <code># 調整行高/<code>

  7. <code>worksheet.row_dimensions[h].height = 6/<code>

這裡用到了雙重 for 循環,外層是 <code>width/<code>,裡層是<code>height/<code>,是一列一列的填充顏色,因此判斷<code>ifh==1/<code>,避免多次調整列寬。

3、excel 支持的樣式數量有限

這個問題比較嚴重。如果直接對高清大圖進行操作,最後輸出的 excel 文件在打開的時候,可能會提示我們文件有問題,需要自動修復。

但是等它修復完成之後,會發現填充的所有顏色都消失了!

用 Python 在 Excel 中画出蒙娜丽莎

一開始以為是使用的行列數過多了原因。

查詢資料後發現,13 版 excel 支持的大行數是 1048576,最大列數是 16384,我們使用的單元格數量還遠沒達到限制。

在經過更換圖片、更換 excel 版本,修改代碼等不充分各種測試,才找到問題的原因所在。

原來是因為,excel 的原形是由多個 xml 文件,填充的顏色都存儲在一個 <code>style.xml/<code>文件裡面,當這個文件過大就會導致打開的時候報錯。

所以為了解決這個問題,有兩個解決方案,第一是縮小圖片,第二是減少圖片顏色。縮小圖片的時候自帶減少圖片顏色的功能,減少圖片顏色的方法可以採用灰度化、二值化等方法。

總體上來講,就是需要控制 <code>顏色數量*單元格數。/<code>

  1. <code>MAX_WIDTH = 300/<code>

  2. <code>MAX_HEIGHT = 300/<code>

  3. <code>def resize(img):/<code>

  4. <code>w, h = img.size/<code>

  5. <code>if w > MAX_WIDTH:/<code>

  6. <code>h = MAX_WIDTH / w * h/<code>

  7. <code>w = MAX_WIDTH/<code>


  8. <code>if h > MAX_HEIGHT:/<code>

  9. <code>w = MAX_HEIGHT / h * w/<code>

  10. <code>h = MAX_HEIGHT/<code>

  11. <code>return img.resize((int(w), int(h)), Image.ANTIALIAS)/<code>

  12. <code>複製代碼/<code>

最終效果

蒼天不負有心人,打開最後輸出的 excel 已經可以看到效果了!

用 Python 在 Excel 中画出蒙娜丽莎

所以說,一切能用 Python 解決的問題,最終都會用 Python 來解決。

全部代碼

  1. <code># draw_excel.py/<code>


  2. <code>from PIL import Image/<code>

  3. <code>import openpyxl/<code>

  4. <code>from openpyxl.styles import fills/<code>

  5. <code>import os/<code>


  6. <code>MAX_WIDTH = 300/<code>

  7. <code>MAX_HEIGHT = 300/<code>


  8. <code>def resize(img):/<code>

  9. <code>w, h = img.size/<code>

  10. <code>if w > MAX_WIDTH:/<code>

  11. <code>h = MAX_WIDTH / w * h/<code>

  12. <code>w = MAX_WIDTH/<code>


  13. <code>if h > MAX_HEIGHT:/<code>

  14. <code>w = MAX_HEIGHT / h * w/<code>

  15. <code>h = MAX_HEIGHT/<code>

  16. <code>return img.resize((int(w), int(h)), Image.ANTIALIAS)/<code>



  17. <code>def int_to_16(num):/<code>

  18. <code>num1 = hex(num).replace('0x',''

    )/<code>

  19. <code>num2 = num1 if len(num1) > 1else'0'+ num1/<code>

  20. <code>return num2/<code>



  21. <code>def draw_jpg(img_path):/<code>


  22. <code>img_pic = resize(Image.open(img_path))/<code>

  23. <code>img_name = os.path.basename(img_path)/<code>

  24. <code>out_file = './result/'+ img_name.split('.')[0] +'.xlsx'/<code>

  25. <code>if os.path.exists(out_file):/<code>

  26. <code>os.remove(out_file)/<code>


  27. <code>workbook = openpyxl.Workbook/<code>

  28. <code>worksheet = workbook.active/<code>


  29. <code>width, height = img_pic.size/<code>


  30. <code>for w in range(1, width +1):/<code>


  31. <code>for h in range(1, height +1):/<code>

  32. <code>if img_pic.mode == 'RGB':/<code>

  33. <code>r, g, b = img_pic.getpixel((w - 1, h -1))/<code>

  34. <code>elif img_pic.mode == 'RGBA':/<code>

  35. <code>r, g, b, a = img_pic.getpixel((w - 1, h -1))/<code>


  36. <code>hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)/<code>


  37. <code>cell = worksheet.cell(column=w, row=h)/<code>


  38. <code>if h == 1:/<code>

  39. <code>_w = cell.column/<code>

  40. <code>_h = cell.col_idx/<code>

  41. <code># 調整列寬/<code>

  42. <code>worksheet.column_dimensions[_w].width = 1/<code>

  43. <code># 調整行高/<code>

  44. <code>worksheet.row_dimensions[h].height = 6/<code>


  45. <code>cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)/<code>


  46. <code>print('write in:', w,' | all:', width +1)/<code>

  47. <code>print('saving...')/<code>

  48. <code>workbook.save(out_file)/<code>

  49. <code>print('success!')/<code>


  50. <code>if __name__ == '__main__':/<code>

  51. <code>draw_jpg('mona-lisa.jpg')/<code>

附:

上面說到 <code>顏色數量*單元格數的時候,可能有人會有疑惑,這個<code>256^4/<code>是怎麼來的。/<code>

這個當然是我測試信口開河得來的。

既然是有 <code>顏色數量/<code>跟<code>單元格數/<code>這兩個變量,那麼自然要有兩個測試方法以上。一個觀察<code>顏色數量/<code>,一個觀察<code>單元格數/<code>。

但我在這裡只做了 <code>顏色數量/<code>的一個測試。(最大的原因就是生成上萬行*上萬列的 excel 實在是太久了...懶...)

  1. <code>count = 0/<code>

  2. <code>MAX_WIDTH = 255/<code>

  3. <code>for w in range(1, MAX_WIDTH +1):/<code>

  4. <code>for h in range(1, MAX_WIDTH +1):/<code>

  5. <code>cell = worksheet.cell(column=w, row=h)/<code>

  6. <code>if h == 1:/<code>

  7. <code>_w = cell.column/<code>

  8. <code>_h = cell.col_idx/<code>

  9. <code># 調整列寬/<code>

  10. <code>worksheet.column_dimensions[_w].width = 1/<code>

  11. <code># 調整行高/<code>

  12. <code>worksheet.row_dimensions[h].height = 6/<code>


  13. <code>if count < 255**3:/<code>

  14. <code>back = int_to_16(num=count)/<code>

  15. <code>back = '0'* (6- len(back)) + back/<code>

  16. <code>else:/<code>

  17. <code>back = ''.join([int_to_16(random.randint(0,255)) for _ in range(3)])/<code>

  18. <code>cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)/<code>

  19. <code>count += 1/<code>


<code>count/<code>是記錄顏色的變量,確保每一個顏色都不重複,但目前計算機 RGB 表示的顏色最多隻有 256^3 種

通過調整 <code>MAX_WIDTH/<code>的值來測試 excel 的閾值

最後生成的測試 excel 如下:

用 Python 在 Excel 中画出蒙娜丽莎

...還有點好看。!??

最後

由於精力有限 懶,能力也有限 菜,所以沒有測試單一顏色的,也可能有其他的方法能沒有這個閾值的限制。

代碼已經全部上傳至github,歡迎大家友好交流討論 [握手]

後臺回覆【蒙娜麗莎】即可獲取代碼鏈接。本文原文鏈接:https://juejin.im/post/5ddbdf3ce51d45230747a19b

簽到送書計劃

自律改變自我!第①期打卡送書活動啟動!

我發起了一個簽到送書活動,活動結束後將送出 5 本 Python 技術書。簽到次數越多,中獎概率越高。活動詳情,請點擊:自律改變自我!第①期打卡送書活動啟動!

下面是今天的簽到二維碼:

用 Python 在 Excel 中画出蒙娜丽莎

回覆關鍵詞「」,將數字替換成 0 及以上數字,有驚喜好禮哦~

好文和朋友一起看~


分享到:


相關文章: