信息架構師、資料庫管理員和數據科學家等,值得關注的熱門職位

數據質量決定了數據對業務的內在價值。信息技術只是這個內在價值的放大鏡。因此,高質量的數據與有效的技術相結合是一項巨大的資產,但低質量的數據與有效的技術相結合也是一項巨大的責任。


信息架構師、數據庫管理員和數據科學家等,值得關注的熱門職位


數據管理需要對數據以及相應的數據定義或元數據進行適當的管理。它旨在確保(元)數據質量良好,因此是有效和高效管理決策的關鍵資源。數據質量(DQ)通常被定義為“適合使用”,這意味著該概念的相對性質。

在另一個決策環境中,即使是同一個業務用戶,原來其質量可接受的數據可能被認為質量較差。例如,分析性銷售預測任務的數據可能不能滿足會計任務數據的要求。

數據質量決定了數據對業務的內在價值。信息技術只是這個內在價值的放大鏡。因此,高質量的數據與有效的技術相結合是一項巨大的資產,但低質量的數據與有效的技術相結合也是一項巨大的責任。這有時也被稱為GIGO或“無用輸入,無用輸出”原理,即使採用了最好的技術,也會導致獲得錯誤數據的結果。

01、信息架構師

信息架構師負責設計概念數據模型,並與業務用戶進行溝通和對話。其彌合了業務流程和IT環境之間的鴻溝,並與可能有助於選擇概念數據模型類型(例如EER或UML)和數據庫建模工具的數據庫設計師密切合作。在數據準確性和數據完整性方面,一個良好的概念數據模型是存儲高質量數據的關鍵要求。

02、數據庫設計師

其職責是將概念數據模型轉換為邏輯和內部數據模型,協助應用程序開發人員定義外部數據模型的視圖,從而有助於數據安全。為了便於將來對數據庫應用程序進行維護,數據庫設計人員在創建強制實現數據一致性的各種數據模型時,應定義公司範圍的統一命名約定。

03、數據管理員

數據管理員是數據質量(DQ)專家,負責確保實際業務數據和相應元數據的質量。他們通過執行廣泛和定期的數據質量檢查來評估數據質量(DQ)。除其他評估步驟外,這些檢查涉及應用或計算最相關的數據質量(DQ)維度的數據質量指標和指標。

顯然,他們也需要主動採取行動,並進一步處理這些評估的結果。第一類應採取的措施是採取糾正措施。但是,數據管理員不負責自行更正數據,因為這通常是數據所有者的責任。對數據質量評估結果採取的第二種行動涉及深入調查所發現數據質量問題的根本原因。

瞭解這些原因可能允許設計旨在消除數據質量問題的預防措施。預防措施可能包括修改數據來源的操作信息系統(例如,使字段成為強制性的,提供可能值的下拉列表,使界面合理化等)。

總體而言,防止錯誤數據進入系統通常比事後糾正錯誤更具成本效益。但是,由於輸入數據中存在不必要的數據質量問題,因此應注意不要減慢關鍵流程。

04、數據庫管理員

其職責是負責實施和監視數據庫。其工作內容包括:安裝和升級DBMS軟件、備份和恢復管理、性能調整和監控、內存管理、複製管理、安全性和授權等。數據庫管理員(DBA)與網絡和系統管理員密切合作。

其還與數據庫設計人員進行交流,以降低運營管理成本,並保證達成一致的服務水平(例如響應時間和吞吐率)。數據庫管理員(DBA)可以提供數據可用性和可訪問性,以及其他兩個關鍵數據質量維度。

05、數據科學家

數據科學家在數據管理的背景下是一個相對較新的職位。其負責使用最先進的分析技術分析數據,以提供新的見解,例如客戶行為。數據科學傢俱有將ICT技能(如編程)與定量建模(例如統計)、業務理解、溝通和創造力相結合的多學科特徵。

一位優秀的數據科學家應該擁有Java、R、Python、SAS等語言的良好編程能力。編程語言本身並不重要,只要數據科學家熟悉編程的基本概念,並知道如何使用這些來自動執行重複任務或執行特定例程即可。

顯然,數據科學家應該有統計學、機器學習和/或定量建模方面的全面背景。從本質上講,數據科學是一項技術練習。分析模型和商業用戶之間往往存在巨大差距。為彌合這一差距,溝通和可視化設施是關鍵。數據科學家應該知道如何通過使用交通信號燈方法,OLAP(在線分析處理)設施,如果當時的業務規則等以用戶友好的方式表示分析模型、附帶的統計數據和報告。

數據科學家至少需要兩個層面的創造力:在技術層面上,重要的是在數據選擇、數據轉換和清理方面進行創新。在分析層面上,標準分析過程的步驟必須適應每個特定的應用,而“正確的猜測”往往可以產生很大的差異。分析是一個快速發展的領域。

新的問題、技術和相應的挑戰不斷湧現。數據科學家必須跟上這些新的發展和技術發展的步伐,並且有足夠的創造力來看待他們如何能夠創造新的商業機會。這些數據科學家在當今的就業市場很難獲得,這並不奇怪。然而,數據科學家有助於提供新的數據和/或見解,這可以讓企業利用新的戰略商業機會。

總而言之,確保高質量的數據是綜合各種技能的多學科練習。在此從數據質量的角度回顧了以下數據管理作業配置文件:信息架構師、數據庫設計師、數據所有者、數據管理員、數據庫管理員、數據科學家。

在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產業的朋友,可以收藏多智時代,及時獲取人工智能、大數據、雲計算和物聯網的前沿資訊和基礎知識,未來的你,是想做信息架構、還是數據管理,或是數據科家,一起來聊聊吧


分享到:


相關文章: