世界將不斷朝著數據驅動的方向邁進

近年來,互聯網產品月活躍用戶人數破億已經不再是什麼大新聞,而且用戶破億所花的時間也越來越短。2013年iTunes花了100個月,而遊戲《Pokemon Go》只用了短短几天。用戶交互數據的激增,讓很多人看到了通過挖掘數據可以獲得行業洞見,從而構建偉大產品的可能。在這個過程中,數據科學家將發揮更大的作用,數據科學家們正在影響企業的關鍵產品策略,並通過改進算法來優化決策方式。

這是《手把手教你建立數據型公司系列》的第二篇。在上一篇文章中,我們討論了建立數據型公司必須關注數據的影響力和建設企業的數據型文化。在今天的文章中,我們將重點介紹為何數據科學如此重要、數據科學家的職責,以及數據科學的發展前景。本文研究成果來自紅杉美國數據科學團隊。

以下是本文的內容要點:

▨ 數據科學的應用範圍在不斷擴大,創造了巨大的價值,但仍處在起步階段。

▨ 藉助數據來改進產品,已經成為企業的一個競爭優勢。

▨ 數據科學家正在影響企業的關鍵產品策略,並通過改進算法來優化決策方式。

▨ 世界將不斷朝著數據驅動的方向邁進。

世界將不斷朝著數據驅動的方向邁進


數據科學到底是什麼?數據科學是一門求真的學科,它利用數據提取知識,獲得行業洞見。數據科學的應用範圍不斷擴大,為各個行業創造了巨大的價值。但和其他尚在發展的領域一樣,數據科學仍處在起步階段。最重要的是為這一學科留下發展的空間,而不是糾結於它的分類——是數據驅動型(Data-driven),還是數據知情型(Data-imformed)。

為什麼數據科學如此重要?

今天,由於互聯互通程度的加深、雲儲存和計算成本的下降,創建一個科技公司的難度也隨之降低。因此,產品月活躍用戶人數破億所需的時間也大大縮短。2013年,iTunes的月活躍用戶人數破億花了100個月,而遊戲《Pokemon Go》只用了短短几天。下圖中包含了一些典型的案例,其中手機是月活躍用戶人數最早破億的產品。

世界將不斷朝著數據驅動的方向邁進

互聯網產品數量的增多和人們在線時間的延長,使得用戶交互數據激增。通過挖掘這類數據發現行業洞見,從而構建偉大產品,激發了人們極大的興趣。企業能否對來源多樣、海量雜亂的數據進行有效分析和利用,推動產品創新,成為衡量企業競爭力的新標尺。

對於數據型公司的產品團隊來說,數據分析的關鍵作用集中在以下四點:

▨ 評估健康程度

對企業產品或企業本身進行健康分析和評估,是數據分析的重要作用之一。確立了產品成功的標準後,接下來就是對相應標準進行監督,確保方向正確和目標達成。

▨ 打造正確的產品和功能

數據分析的另一個重要作用就是確保打造出正確的產品和功能。通常,數據科學家會幫忙設計實驗,提出假設,藉助數據信息,指導產品團隊不斷優化產品。

▨ 預測結果,為產品系統賦能

數據科學家可以藉助人工智能或機器學習來構建產品原型/模型,為產品系統賦能,比如,通過對某一機器學習模型進行訓練,來預測前景和趨勢。

▨ 為產品制定流程和策略

對用戶軌跡和某些現象的深入分析,能夠帶來關鍵的行業洞見,幫助公司制定產品流程和策略,這也是世界級產品分析團隊最重要的作用。

世界將不斷朝著數據驅動的方向邁進


數據科學家的職責

數據科學家本身涵蓋了多個角色,在不同的公司、行業,具體的角色也天差地別,但一般可以分為以下兩類:

▨ 產品分析師

產品分析師的職責是交付數據知情型內容,用於產品或策略的改進。

▨ 算法開發員

算法開發員的職責是將數據驅動型功能融入到產品中,例如,優化推薦內容或搜索結果。

產品分析師側重於制定目標,提供產品流程和策略。他們的主要工作通常是給產品團隊提供一份文件,其中有可量化的問題、已識別的機會,以及基於數據的建議和解決方案。

算法開發員的主要工作是利用數據來優化產品性能。他們為工程團隊提供原型代碼和資源文件,並與工程團隊進行緊密合作,將這些方案應用到生產中。

這兩種數據科學家的能力相似,都要能夠進行分析預測和數據量化。但算法開發員需要擁有更多複雜的技術知識(如機器學習、人工智能),而產品分析師則需要有更多解決問題的能力,包括能與相關管理者有效溝通。

一般來說,產品分析師屬於數據知情型,而算法開發員屬於數據驅動型。

並不是所有企業都需要算法開發員,但所有企業(尤其是那些用戶基礎雄厚的企業)都需要產品分析師,因為他們可以解決產品的問題,提高產品競爭力,幫助企業更好地應對戰略上的挑戰。

世界將不斷朝著數據驅動的方向邁進


數據科學的演變

試想這樣一個世界,機器知道你喜歡的事物,瞭解你的選擇偏好,不用具體詢問就知道該為你購買哪些東西,可以幫助你做很多決定,包括幫助你規劃人生。

這樣的世界在短期內可能還無法實現,它存在於人工智能成為我們的“生活大管家”的未來,那時可能大部分事務由AI負責。為了朝著這一夢想邁進,我們需要在數據驅動上更進一步。

在一個機器擁有完備信息的世界中,AI 清楚地知道你行為背後的原因,以及各種原因之間的相互作用機制,這需要數據驅動與數據知情的結合。

在純粹使用數據驅動方式決策時,數據是唯一的重要因素。而使用數據知情方式決策時,數據是一個重要因素,但不是唯一的。

當未來越來越多的流程實現自動化,相比於數據知情,世界將更偏向於數據驅動。然而,在近幾十年,數據知情還將持續佔據十分重要的地位,而數據驅動的發展進步則要靠數據知情型人才來推動。

世界將不斷朝著數據驅動的方向邁進


下列例子最能說明數據知情和數據驅動在決策方式上的區別。

▨ 設定目標

目標的確定和追蹤將日益向數據驅動的方向靠攏。例如,Facebook對活躍用戶的追蹤可能是一個全自動化的過程,是純粹的數據驅動。但在制定恰當的季度和年度活躍用戶數量目標和收益目標時,可能就不再是全自動化了,其中摻雜了數據知情型的方法。

▨ 確立流程和戰略

流程和戰略的制定是難以量化的,因此需要採用數據知情的方法。一個好的流程路線圖會考慮到相關目標、這些目標的驅動因素、產品團隊手中的槓桿,以及可行的行動方案。

▨ 結果預測

結果預測主要為數據驅動型。例如,要確定是否要推送某個內容,需要考慮用戶點擊或閱讀該內容的概率等多種因素。在進行結果預測時,企業通常會進行模型開發,並不斷對模型進行迭代。

▨ 為產品系統賦能

對於PayPal這類公司來說,對每筆交易都進行詐騙活動的人工審核,成本高昂。因此,它們多依靠機器學習來增強產品系統的能力,實現審核的自動化和概率評估的自動化。然而,對於那些概率評估置信水平較低的領域,決策方式就可能更偏向數據知情型。


分享到:


相關文章: