03.07 如何才能做到善於獲取數據、分析數據、運用數據?

喬喬


這些是數據分析師關注的焦點問題

1獲取數據

首先確定數據源是什麼、在哪裡、獲取方法及權限等;數據源是個相對概念,有深淺之分,最深層次的根源數據源一般都是源自業務實踐產生,比如產品APP埋點技術獲取用戶PV/UV類線上流量數據明細,比如手工採集實際業務運作過程中產生的線下數據(比如登記表等)...這些都是最深層次的數據源,根據實際需要將這些數據進行一層層加工(格式優化、內容增減、數據聚合簡化標準化等)後形成靠上層的新數據源

然後根據獲取數據源流程進行實際操作;公司內部大數據離線和實時系統數據源是公司最高級機密數據源,必須經過公司授權才能獲取,公司對外數據源可以通過公司發佈的正規渠道獲取(官網、指定途徑等)。有些技術高手總想通過爬蟲技術鑽法律空子爬取別家公司的機密數據,這類操作是高風險、不可取的

最後將寶貴數據合理存儲起來,一般數據源複用性都很強,要養成及時合理保存、存儲的好習慣

2分析數據

拿到數據源後先進行清晰,然後才能根據實際業務需要進行分析,分析要有目標、或者帶著問題去分析。

一是少量(不必使用大數據處理技術的)數據的統計分析,運用本地常用辦公軟件(比如offive等)、本地常用統計分析軟件(Python/R/SP等SS)就能處理,涉及統計學、高數、概率論等基礎數學計算知識

二是大規模數據的數據挖掘,由於數據規模很大導致本地軟件處理不了、只能藉助大數據處理技術進行分析,此類分析將運用高階數學、AI算法等方法

3應用數據

將數據分析結果進行歸納提煉形成可行性的指導建議,應用在實際業務生產中,促進業務向前發展

4注意事項

數據源獲取分2類,1類是直接獲取(非技術人員不用寫代碼即可獲取,比如從實時系統查詢、下載、導出到本地)2是代碼提取(需專業開發人員進行代碼開發、運行後獲取)。

數據源是數據分析階段的輸入、應用數據優化建議是數據分析階段的輸出,分析不是目的、分析是獲取有指導業務發展類優化建議的必經途徑/方法





數據智能時代


我覺得這個問題的關鍵在“善於“二字。

怎樣能做到善於呢?——數據思維

這個和寫議論文一樣: 論點、論據、論證。和問題中的獲取數據、分析數據、運用數據是一樣的。

這樣就簡單了,只要思路有條理,有邏輯,環環相扣,再加上技術手段做輔助,就能做到“善於”了。


老劉說IT的那些事


獲取,分析,運用是數據實現其價值的比較重要的三個步驟:

獲取數據:

1、描述一個事物的數據有千百個維度,比如電商,僅僅流量這一個概念就包含N多個指標,進到平臺的有多少人,這些人中有多少是第一次來,有多少未購買,有多少之前有瀏覽等等,所以一個平臺從一個用戶進來開始就產生了大批量各種維度的數據,但是並不是每個維度的數據都是需要關注的。比如一個人有身高、體重、年齡數據,你要了解一個人的身高,有必要非要把年齡數據拉出來嗎?

2、獲取數據,首先要了解你的業務形態是什麼,能夠體現你這種業務形態的現有指標及可能指標都有哪些;然後詢問資深同學能實現的指標有哪些,不能實現的指標是否有可替代方案,數據存放在哪些表中,表的使用方法是什麼。


分析數據:

分析數據是一個比較泛泛的描述。數據提取出來了,我可以從月彙總,可以求日均,可以橫著加,可以豎著乘,一批數據,我們能進行360度的發散,但是360度中有359度可能都是在做無用功,所以你要明確分析數據的目的是為了做什麼?有明確的目的後,我們可能就不是360度發散,而是在0-10度的空間中發揮。怎麼快速的找到正確的方向,還要依賴你的業務理解,邏輯思維和靈感。

分析數據:判斷用對比,原因用細分


運用數據:

以上兩個步驟,獲取數據,分析數據的最終目的都是落地到了數據的運用上來。數據如果不能和實際結合,在實踐中產生價值,那數據驅動增長的價值也就無從說起了。運用數據更多的是要把分析結果中體現的優化點和業務結合,比如我們分析一個專營女性上衣的淘寶店鋪現在用戶增長乏力的主要原因是店鋪商品沒有跟上時尚潮流,大趨勢都是在用紗面料,而你的店鋪還在使用棉質面料,那麼接下來我們是否可以運用這個結果來改變我們的進貨方案呢?


總而言之,獲取,分析,運用數據三個過程相輔相成,是一個循環的過程,數據的運用可以反饋到數據的獲取和分析中,數據的分析可以反推數據的獲取和正推數據的運用,數據的獲取是數據分析和運用的基石。


分享到:


相關文章: