Power Query有5大類40種的連接方式,可以連接文件、數據庫、在線服務等等各種數據源。今天我們介紹6種常用的連接方式:
- 自文件中的3種:
- 從工作簿
- 從文本/CSV
- 從文件夾
- 從其他源中的3種:
- 自表格區域
- 自網絡
- 空白查詢
從工作簿建立連接:
Power Query 的一個基本理念,就是數據源隔離,無論你連接哪種數據源,連接之後的所有操作,都不會影響數據源。不過如果你在Excel的數據源工作簿中建立連接,是不會修改數據源,但是這個數據源Excel文件保存的時候,還是有所改變,數據源表被轉換為超級表,文件中多了Power Query查詢。
所以,要保持數據源文件不做任何修改,最好的辦法,就是從工作簿建立連接,這樣就可以在不打開Excel文件的情況下,直接提取數據,不會對Excel文件做任何改動。
步驟很簡單:
- 按下“從工作簿”按鈕
- 選擇文件
- 選擇表
- 編輯
從文本/CSV建立連接:
有些時候數據源是文本文件(後綴TXT或CSV)也可以直接用Power Query來建立連接。步驟和上面一樣,選擇文件建立連接即可。
從文件夾建立連接:
Power Query從文件夾建立連接時,可以自動合併格式相同的文件,多文件合併以往是需要用VBA來實現,有了Power Query之後,多文件合併變得簡單很多。
按下這個按鈕,就會自動合併文件。
前面三種方式都是從文件獲取數據建立查詢,接下來的三種方式就各不相同了
自表格區域:
Power Query中最簡單的建立查詢的方式就是自表格區域建立查詢,只需要一步,選中數據區域按下按鈕就可以了。
這種連接方式通常是單個文件中數據處理使用,不需要建立文件鏈接,直接在文件中做數據處理,也是初學者,最願意使用的方式,簡單直接。
自網絡:
Power Query提供網絡數據抓取功能,這個有點高大上了,通常網絡爬蟲都是用Python等編程語言才能實現的功能。當然Power Query的網絡抓取在效率與功能方面沒辦法和網絡爬蟲相比,但是基本的靜態網頁抓取是沒有問題的。
複製粘貼網絡地址,選擇表就可以了。
建立空白查詢:
Power Query的後臺是M語言,Power Query提供了豐富的M函數,但是有些時候還是需要自定義函數來處理特定的問題,這時候就要用到空查詢,建立空查詢之後,打開高級編輯器,就可以根據M語言的語法規範來編寫自定義函數。
Power Query提供了豐富的數據接口,大家可以根據需要來選擇,具體的數據庫、在線連接操作也不復雜,只要你有權限,根據嚮導填寫所需要的信息,就能建立連接。
閱讀更多 EXCEL數據處理與分析 的文章