一文讀懂BI,商務智能=數據+分析+決策+利益

一、背景介紹

人類社會從物物交換到貨幣的產生,到形形色色的交易,產生了我們現在繁榮、複雜的各種商業活動。利益是商務的核心,而商務需要經過買賣雙方的交易,談判,而商品的流通又需要物流、庫存,其中業務流程十分繁瑣,然而科技進步改善或者正在改變著其形式,人們的工作效率正在極大地提高。

在這個信息化的時代,許多傳統業務被信息化手段所取代或者信息化作為其輔助手段。於是乎,在這個時代,所有的人都在談數據,並且相關的商務數據呈爆炸性指數級的增長。可是,不是所有的數據都是有用的,所以人們需要從中挖掘有用的信息,用以指導現實工作。

商務智能,英文為Business Intelligence,簡寫為BI。商務智能通常被理解為將企業中現有的數據轉化為知識,幫助企業做出明智的業務經營決策的工具。比如,百貨商場每天有各種各樣的商品被出售,其POS系統存儲著商品的銷售情況,數據量十分龐大。從這些數據,我們利用一定的數學模型和智能軟件工具進行分析,知道哪些產品最熱銷,哪些時段人們喜歡購買什麼。接著,運用分析後的結果進行決策,比如分析後得知下雨天的時候啤酒和炸雞的銷量比其他天氣時段更多,於是我們決定在下雨的日子增大啤酒和炸雞的產量。通過這些分析和決策,我們得到了商業利潤的增加,這種利潤是我們利用現代工具進行商務智能的動力。這個過程可以總結為以下的一個等式:

商務智能=數據+分析+決策+利益

二、數據獲取

傳統的數據獲取是手工進行紙質記錄,缺點是記錄容易出錯,且隨著時間的流動,其數量會大大增加以致於查找歷史數據的困難。比如,傳統地主家的管家進行家庭財政的登記,賬本厚又重,對賬極其麻煩,而且說不定賬本會因為火災或各種原因而破損,如被老鼠咬爛了。

隨著科技的進步,有了計算機,於是數據存到了磁帶,然後是磁盤。世界上有了社會分工而美妙,每個人都在自己擅長的領域工作,從而創造著更大的利益。於是乎,不懂計算機的小夥伴藉助著別人開發的管理系統進行數據的管理,比如超市的商品管理系統,公司內部的人員管理系統。而軟件程序員藉助了數據庫,數據倉庫等產品進行設計編碼,創造了上述的管理系統。

於是,一層接力一層,數據的獲取從手工一個個用筆記下來到使用計算機鍵盤進行錄入。通過現代科技手段,查看歷史數據只要進行搜索,很快很好就能得到十年前的數據,從而可以更大效率地進行數據分析。

商務智能,智能二字凸顯了計算機的重要性。計算機的一切都是0,1二進制組成,這兩個最普通不過的符號構建了計算機整個數據大廈。如何更好的將數據存到計算機磁盤中,並迅速的讀取出來呢?早期的數據存儲是使用卡片進行數據讀取,後來便產生了現代計算機的存儲體系,寄存器,內存,磁盤。從硬件開始,後來出現了軟件層面的文件系統,IO流。為了更方便存儲大量數據,出現了數據庫軟件,各種數據庫理論和工具開始出現。

目前使用最多的數據庫是1993年E.F.Codd提出的關係數據庫。

三、數據分析

數據分析方面主要依賴數據挖掘方面的知識,因為商務智能是數據挖掘領域的一個分支。數據挖掘一般是指從大量的數據中通過算法搜索隱藏於其中信息的過程。數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。

數據挖掘利用了來自如下一些領域的思想:

(1) 來自統計學的抽樣、估計和假設檢驗

(2)人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。數據挖掘也迅速地接納了來自其他領域的思想,這些領域包括最優化、進化計算、信息論、信號處理、可視化和信息檢索。一些其他領域也起到重要的支撐作用。特別地,需要數據庫系統提供有效的存儲、索引和查詢處理支持。源於高性能(並行)計算的技術在處理海量數據集方面常常是重要的。分佈式技術也能幫助處理海量數據,並且當數據不能集中到一起處理時更是至關重要。

主要的分析算法有分類(Classification)估計(Estimation)預測(Prediction)相關性分組或關聯規則(Affinity grouping or association rules)聚類(Clustering)等。這些算法主要依賴數學大廈進行構建,大多數商業數據挖掘軟件已經實現了這些功能,方便普通人士的使用。

通過使用數據挖掘軟件,可以對存儲在數據庫中的數據進行分析處理,得到一定的統計和計算結果。這些結果可以指導現實的決策。

目前的數據挖掘軟件有一般分析目的用的軟件包SAS Enterprise Miner,SPSS Clementine,IBM Intelligent Miner等,針對特定功能或產業而研發的軟件KD1(針對零售業)Options & Choices(針對保險業)HNC(針對信用卡詐欺或呆帳偵測)Unica Model 1(針對行銷業)iEM System (針對流程行業的實時歷史數據)。

四、商務決策

隨著數據庫技術的發展和應用,數據庫存儲的數據量從20世紀80年代的兆(M)字節及千兆(G)字節過渡到現在的兆兆(T)字節和千兆兆(P)字節,同時,用戶的查詢需求也越來越複雜,涉及的已不僅是查詢或操縱一張關係表中的一條或幾條記錄,而且要對多張表中千萬條記錄的數據進行數據分析和信息綜合,關係數據庫系統已不能全部滿足這一要求。在國外,不少軟件廠商採取了發展其前端產品來彌補關係數據庫管理系統支持的不足,力圖統一分散的公共應用邏輯,在短時間內響應非數據處理專業人員的複雜查詢要求。

聯機分析處理(OLAP)系統是數據倉庫系統最主要的應用,專門設計用於支持複雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以根據分析人員的要求快速、靈活地進行大數據量的複雜查詢處理,並且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們準確掌握企業(公司)的經營狀況,瞭解對象的需求,制定正確的方案。.

OLAP工具是針對特定問題的聯機數據訪問與分析。它通過多維的方式對數據進行分析、查詢和報表。維是人們觀察數據的特定角度。例如,一個企業在考慮產品的銷售情況時,通常從時間、地區和產品的不同角度來深入觀察產品的銷售情況。這裡的時間、地區和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維數組則是OLAP分析的基礎,可形式化表示為(維1,維2,……,維n,度量指標),如(地區、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的數據採取切片(Slice)、切塊(Dice)、鑽取(Drill-down和Roll-up)、旋轉(Pivot)等各種分析動作,以求剖析數據,使用戶能從多個角度、多側面地觀察數據庫中的數據,從而深入理解包含在數據中的信息。

商務決策使用了上述的數據挖掘軟件得出的結果,而OLAP是一個更加方便的系統,更快更好的將分析的結果以圖表等方式進行展示,方便決策人員進行對比、討論。通過智能化工具的處理後,領導和改革者可以決定是否開展某項業務,或者如何進行某項業務,這也是稱之為商務決策的原因。

五、利益動力

商業智能的關鍵是從許多來自不同的企業運作系統的數據中提取出有用的數據並進行清理,以保證數據的正確性,然後經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合併到一個企業級的數據倉庫裡,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變為輔助決策的知識),最後將知識呈現給管理者,為管理者的決策過程提供支持。

商務智能=數據+分析+決策+利益,等式包含了利益,是因為利益作為一種動力,促進了商務智能的發展。因為想改變,所以改變。因為想提高效率,所以改變。因為要以最小的投入掙得最大的利益,所以要改變。人類生活的改變來源人類對美好生活的追求,想把人類從繁忙的體力勞動中解放出來。計算機這一科技產物,與商務聯繫起來,必定創造極大的價值。

六、總結

我們可以預示出,在將來的日子,商務智能必將蓬勃發展,一路高歌,這也為我們個人和國家做出了提示。商務智能並不神秘,它就如此簡單,總結是:商務智能=數據+分析+決策+利益


分享到:


相關文章: