POWER BI系列教程之Power query不同數據源數據導入操作詳解

要開始商業數據分析,第一步需要的就是獲取數據,然後對數據進行必要的清洗以及整理。Power Query就是獲取數據以及進行數據整理的工作,今天我們就先介紹一下如何通過Power Query獲取外部的數據。Power Query幾乎支持從目前市面上可見的各種數據源中導入數據,可以說是為公司中各個不同的數據源之間打通了一個溝通的橋樑。

一、從Excel文件中獲取數據

從Excel文件中獲取數據是比較常見的業務場景,從Excel中導入數據常見的有兩種方式,第一是直接將一個工作簿的數據進行導入,第二是通過表(表是Excel新版本中新增的一個概念,如果沒有接觸過的自行百度)的形式導入,下面詳細講解操作方式。

1.從表格導入

在【數據】選項卡下的【獲取和轉換】中有一個【從表格】的按鈕,定位在工作表中的數據區域,直接點擊該按鈕即可,此時數據就會加載到power query編輯器中。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

2.從工作簿導入

在【數據】選項卡下的【獲取和轉換】下的【新建查詢】下的【從文件】的【從工作簿】按鈕,可以從外部工作簿中導入文件。


POWER BI系列教程之Power query不同數據源數據導入操作詳解

點擊按鈕後,選擇需要導入數據的工作簿,出現以下窗口。如果需要同時導入多個工作表的數據,勾選【選擇多項】前面的複選框就可以同時選擇多個工作表進行導入。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

二、從文本文件進行導入

在我們工作中,還有一類數據是以文本格式進行存儲的,常見的是txt格式或者csv格式,對於此類數據power query同樣可以完美的導入。

1.csv導入

CSV文件一般是以逗號(,)分隔的一些結構化數據,如下圖所示。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

通過【數據】選項卡下的【獲取和轉換】下的【新建查詢】下的【從文件】的【從CSV】按鈕,可以導入CSV文件,在導入CSV文件時,需要根據文件的編碼格式正確選擇編碼格式(常見的有UTF8,GBK,GB2312等)和分隔符(常見的為逗號)才能確保數據的正確導入。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

2.txt文本文件

txt文本文件和CSV文件的操作時類似的。

3.xml文件

可擴展標記語言,標準通用標記語言的子集,簡稱XML。是一種用於標記電子文件使其具有結構性的標記語言。同樣可以把xml的數據導入Excel中。

三、從數據庫導入

數據庫是我們在商業數據分析中獲取數據的一個重要來源,通常情況下企業都會有一些自己的業務系統,業務系統中都有數據庫,我們可以通過直接連接業務數據庫進行數據分析。Power query基本上支持市面上常見的所有主流數據庫,可以通過兩個方式進行連接,具體介紹如下。

1.通過從數據庫選項連接

在新建查詢下的【從數據庫】選項中,Excel提供了sqlserver、access、sqlserver analysis services三種數據庫的連接,如果你使用的是此類數據庫,可以直接通過該選項連接。其中sqlserver也是我們使用非常多的一個數據庫產品。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

下面給大家介紹下sqlserver導入數據的基本操作。選擇【從sqlserver數據庫】,然後在彈出的框中輸入服務器地址,首次連接的時候還會要求輸入連接數據庫的用戶名及密碼,正確輸入後就會跳轉到導入數據的窗口,選擇需要導入數據的數據庫和表格即可完成導入。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

2.通過ODBC數據源導入

藉助ODBC數據源,我們可以連接其他常見的數據庫,比如mysql、oracle等等。這裡就以我們日常工作中使用較多的mysql進行介紹,關於mysql的安裝及基本使用,可以參考我之前發的文章 。

首先需要在ODBC理中添加數據源,具體設置方法大家不會的自行百度。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

通過【數據】下的【從其他源】中的從ODBC,選擇已經添加好的數據源,此時就可以成功的從該數據源中加載到數據,如下圖所示。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

四、從網頁導入

在我們日常的工作中,還有一些場景是我們需要從網頁獲取一些數據進行分析(也就是我們常說的網抓),對有比較簡單的網抓,我們完全可以通過power query來實現。

比如如下的雙色球開獎網頁,我們想要獲取開獎結果的表格。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

我們可以通過【數據】下的【新建查詢】中的【從其他源】下的【自網站】,power query就能解析出網頁中的內容,如下圖,直接選擇表格導入數據即可。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

導入後效果如下圖。

POWER BI系列教程之Power query不同數據源數據導入操作詳解

以上是數據導入的一些基本操作,在之後的內容中,我還會給大家講解power query中的M語言,當學習了M語言後,我們還可以對數據的導入通過M進行一些更有針對性的操作,請大家繼續關注。

如果需要獲取我文章中的示例文件及數據,請關注我後私信【bi數據導入】免費獲取。


分享到:


相關文章: