02.28 如何從SaaS應用程序中查詢和提取數據

幾乎每個企業都可以從SaaS數據中獲得價值,人們需要了解更有效地集成它的三種方法。

在每一個SaaS應用程序背後,都有存儲有關員工、供應商、客戶和其他合作伙伴業務信息的數據庫。SaaS應用程序支持工作流程,例如用於銷售和市場營銷的客戶關係管理(CRM),用於財務的雲計算企業資源計劃(ERP),用於人力資源功能的勞動力管理,以及其他企業和部門服務。如今,許多企業使用廣泛的SaaS應用程序,從主流產品(如Salesforce、Slack、Workday、Atlassian)到許多規模較小的SaaS工具。

SaaS應用程序不應在孤島上運行,大多數企業都需要在它們之間以及與在私有云或公共雲中管理的其他企業應用程序集成功能。

如果跨多個應用程序的工作流需要應用程序集成,則開發團隊可以利用SaaS平臺的API觸發從一個平臺到另一個平臺的事件。當許多應用程序和服務需要集成時,可以選擇諸如Boomi、SnapLogic或MuleSoft之類的企業集成平臺。如果需要遵循IFTTT模式的輕量級集成,則其平臺可能會提供足夠的集成。如果開發團隊正在開發連接到多個SaaS和企業工作流的新應用程序,則他們還應該探索Appian、OutSystems和PowWow等低代碼平臺。

利用SaaS數據滿足不同的業務需求

如果企業需要將SaaS平臺中的數據與其他數據源集成在一起怎麼辦?出於以下原因,可能需要跨SaaS工具進行數據集成:

•業務分析師希望使用數據來開發報告和儀表板。

•數據科學團隊希望將數據用於機器學習實驗。

•業務團隊希望集中數據以支持工作流和其他類型的應用程序。例如,營銷團隊經常使用客戶數據平臺或主數據平臺來集中有關客戶、到產品和其他業務實體的數據。

•IT團隊應提取數據進行備份,或允許將數據轉換到其他平臺。

•法律團隊有時需要對基礎數據執行法律查詢。

•數據管理員經常希望清理、轉換或豐富基礎數據。

當然,企業可以利用SaaS平臺的API提取數據,但這可能需要大量的開發工作來學習API,瞭解SaaS平臺的數據模型,為任何新數據創建數據存儲,編寫代碼以加載數據,併為任何轉換開發邏輯。此外,IT團隊必須定義雲計算或數據中心基礎設施來託管此應用程序或服務。最後,任何旨在按計劃或按需運行的數據集成都需要持續的支持。從頭開發集成對於具有其他更具戰略意義的優先事項的開發團隊和IT組織而言可能代價高昂。

另一種方法是考慮數據集成、數據流、ETL(提取、轉換和加載)或其他數據準備平臺。在處理頻繁變化的大量數據時,使用數據集成平臺可能是最佳方法,因為這些平臺支持靈活的提取和轉換。然而,在最終用戶訪問和利用信息之前,它們還需要預先開發集成。

可能需要更輕量級的查詢和管理SaaS數據的手段。有時,這些對於快速實驗、發現和原型化很有用。在其他時候,這些方法可以輕鬆地用於運營或生產需求,尤其是在數據量很少且查詢吞吐量不重要的情況下。以下是三個選項:

1.直接查詢SaaS應用程序的商業智能(BI)平臺

如果用戶的要求是獲得報告,那麼許多自助式商業智能(BI)和數據可視化平臺都可以直接連接到更流行的SaaS應用程序。

•Tableau可以連接到Intuit Quickbook、Google Analytics、LinkedIn Sales Navigator、ServiceNow、Eloqua、Marketo和Salesforce等平臺。

•Microsoft Power BI還與在線服務集成,例如Adobe Analytics、Facebook、GitHub、MailChimp、Stripe、Quick Base和Zendesk。

•Domo聲稱擁有一千多個連接器,其中包括HubSpot、Jira、Instagram、Qualtrics、Shopify、SurveyMonkey、Twitter和Workday等平臺。

至少,這些集成提供了一種查詢和發現基礎SaaS數據源的簡便方法。在最好情況下,現成的集成足以使最終用戶創建所需的數據混合、報告和儀表板。

此外還有一些注意事項。

當列具有匹配的鍵時,這些平臺將啟用聯接和數據混合。如果在集成數據源或將其與其他數據源混合之前需要進行大量數據轉換,則它們將變得更難使用。

•審查SaaS數據集成是否通過實時查詢執行,或者數據是否被提取或緩存。

•如果SaaS應用程序包含大量數據,如果與許多其他數據源有複雜的連接,或者許多用戶將同時使用儀表板,那麼性能可能是一個因素。

2.模擬ODBC、JDBC、OData或其他驅動程序的平臺

如果業務需要不只是報告和儀表板,並且仍然需要輕量級的集成方法,那麼一些商業工具會將SaaS API轉換為標準數據庫驅動程序,例如ODBC、JDBC或OData。通用SaaS平臺的驅動程序的兩個選項是Progress DataDirect和CData驅動程序技術。

對於想要在將數據提取到他們的分析之前對SaaS數據庫執行臨時查詢的數據科學團隊,驅動程序方法可能最有用。對於需要實時查詢SaaS應用程序數據的應用程序開發人員來說,這也是一個不錯的選擇。

開發和數據科學團隊應調查此集成的性能,尤其是在需要大量查詢、大型數據集或低延遲的情況下。此外,許多SaaS應用程序會根據API使用情況來限制客戶或向客戶收費,因此如果需要更高的查詢量或數據量,這可能是一個因素。

3. 將SaaS數據同步到雲數據庫的輕量級ETL平臺

最後一個想法是將SaaS應用程序中的數據集成插入到企業設置和管理的雲計算數據庫中。此策略增加了一些操作複雜性和成本,如果需要實時查詢SaaS應用程序數據,則可能不太理想。但它確實有幾個優點:

•它提供對業務用戶、數據科學家(包括公民數據科學家)和應用程序開發人員使用的數據庫平臺和數據體系結構的更多控制。平臺和體系結構應滿足容量、性能和延遲要求。

•獨立於SaaS數據庫存儲數據可提供更大的靈活性,可以根據下游用戶和應用程序的需要轉換、連接、清理、多維數據集或聚合數據。

•如果用於查詢此數據的數據安全性,數據隱私或其他數據治理控件與SaaS應用程序中可用的訪問和權利控件不同,則可能需要將數據託管在單獨的數據庫中。

•獨立於SaaS平臺託管數據對於滿足更高的數據和查詢量需求可能更具成本效益。

儘管企業可以使用數據集成或數據準備平臺來檢測此集成,但是仍有一些SaaS數據集成平臺具有可直接連接到許多SaaS應用程序的連接器。如果企業的目標是將數據從SaaS應用程序流式傳輸到雲計算數據庫,則是一個即插即用的解決方案。企業可以選擇要複製的數據和複製頻率,但是它不提供任何用於轉換或過濾數據的工具。Skyvia公司提供了類似的產品,並且都具有免費層,讓開發團隊可以嘗試集成。Alooma是谷歌雲的一部分,致力於將數據移至Google BigQuery、Amazon Redshift和Snowflake等大數據平臺,並提供一些數據轉換功能。

如果很多企業使用多種SaaS平臺,那麼採用“一刀切”的戰略可能行不通。每個集成路徑都支持不同的SaaS集成,並且集成的類型必須符合預期的業務需求。審查工具並考慮多種選擇是最佳實踐,尤其是在數據集成需求變化的情況下。


分享到:


相關文章: