02.25 Power Query 處理數據的過程---連接、轉換、組合、共享

Excel與Power BI都集成了Power Query組件,作為數據模型設計的第一個模塊,建立數據源與數據模型之間的連接。通常都會用到下面四個步驟:

Power Query 處理數據的過程---連接、轉換、組合、共享

如果你打開微軟的網站,Power Query入門就會有這樣的介紹:

Power Query 處理數據的過程---連接、轉換、組合、共享

結合Excel中的Power Query我們來了解一下Power Query的基本界面:

連接:建立與網絡數據、本地數據、數據庫的連接

Power Query 處理數據的過程---連接、轉換、組合、共享

Power Query提供了豐富的接口,可以與各種格式的數據源建立連接:

其中對於Excel用戶最常用的就是從文件建立連接,如果是深度用戶也會用到數據庫連接、網絡連接等等,Office365、Power BI用戶也會用到在線服務。

Power Query 處理數據的過程---連接、轉換、組合、共享

連接的建立並不複雜,只是需要一定的專業知識以及權限,比如要建立數據庫連接,就要了解數據庫的類型,以及賬號和密碼;最簡單的連接就是自表格區域,選中你要連接的表格,然後按這個按鈕就建立好連接了。學習Power Query就從最簡單的開始,找來一些數據,放在Excel表格中,然後按照上面的步驟建立連接,Power Query的第一步就完成了。

Power Query 處理數據的過程---連接、轉換、組合、共享

轉換:轉換是將連接好的數據,變換成需要的形狀,你儘可以放心操作,無論你如何變幻,Power Query都不會對數據源進行修改。轉換的操作要在Power Query編輯器中進行,這個編輯器在你建立好連接時就會自動打開,對於已建立好的連接,可以通過查詢和連接按鈕打開。

Power Query 處理數據的過程---連接、轉換、組合、共享

這個編輯器後臺是M語言,你的每一步操作都會被翻譯成M語句,翻譯好的M語句可以在高級編輯器中查看或修改。另外每一步操作也會顯示在右側的查詢設置裡,這些步驟你可以隨時進入,並做調整。

Power Query 處理數據的過程---連接、轉換、組合、共享

Power Query的轉換有很多操作,大部分都可以通過按鈕以及對話框的操作來完成,所以熟悉PowerQuery編輯器的操作界面很重要,瞭解每個按鈕的功能,以及按鈕按下去之後出現的對話框如何填寫。

Power Query 處理數據的過程---連接、轉換、組合、共享

Power Query 處理數據的過程---連接、轉換、組合、共享

Power Query 處理數據的過程---連接、轉換、組合、共享

這些按鈕也就對應了Power Query的基本數據轉換功能,學習Power Query轉換就先從這些按鈕學起,不要擔心出錯,因為不會修改你的數據源,隨便操作,大不了放棄從新來過,相信通過一段時間的摸索,就能瞭解一個大概。

Power Query的轉換功能很強大,除了這些按鈕,還有豐富的函數支持,但是學習M函數卻不是那麼容易,如果你對計算機語言有所瞭解,還好一些,通過參考應該可以簡單的使用M函數。而且微軟僅提供英文的參考,這也是Power Query推廣比較慢的原因之一。

Power Query 處理數據的過程---連接、轉換、組合、共享

組合:建立一個數據模型,通常會有多個數據源,將多個轉換後的結果,組合在一起。

組合也是通過按鈕操作來完成的,有兩種基本組合形式,一種是合併查詢,一種是追加查詢。

Power Query 處理數據的過程---連接、轉換、組合、共享

具體應用時,還有很多細節的內容,合併查詢要制定關鍵字段,追加查詢時字段名稱必須一致等等。

共享:Power Query形成的各種見解後,可以加載到表、透視表、透視圖、連接、數據模型、Power BI。

Power Query 處理數據的過程---連接、轉換、組合、共享

Power Query學習的關鍵在與數據轉換與組合,至於連接只是Power Query提供了豐富的數據接口,而共享則是數據轉換和組合後的結果輸出的接口。

所以,大量的Power Query的教程都集中在中間兩步,技巧只是其中一部分,對數據的理解也很重要,轉換和組合出來的結果是否真的具有實際意義也很重要。


分享到:


相關文章: