12.26 新數倉系列:開源組件運營(3)

大數據前幾年各種概念爭論很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,現在這股熱潮被AI接過去了。大數據真正落地到車聯網,分控,各種數據分析等等具體場景。

概念很高大上,搞得久了就會發現,大部分都還是數據倉庫的衍伸,所以我們稱呼這個為“新數倉”,我準備寫一系列相關的文章,有沒有同學願意一起來的?請聯繫我。前面有一些相關文章,大家可以看看:

新數倉系列:Hbase周邊生態梳理(1)

新數倉系列:Hbase國內開發者生存現狀(2)

HBase 和 Cassandra的淺談

數據庫存儲模型簡述

HBASE+Solr實現詳單查詢

產品決定的是長期競爭力,運營決定的是短期用戶體驗。本文簡單梳理下開源組件的運營方法。不正確的,歡迎大家給我留言多討論。

1運營基本概念

運營主要分為內容運營、用戶運營、活動運營和產品運營。

1. 內容運營

內容運營這樣一個分支,其實核心要解決的問題是:圍繞著內容的生產和消費搭建起來一個良性循環,持續提升各類跟內容相關的數據,如:內容數量、內容瀏覽量、內容互動數、內容傳播數……等等。

因而,內容運營這個模塊下要關注和解決的問題可能包括了以下問題中的一個或多個——

  • 我的內容基礎屬性是什麼?(文字?圖片?音頻?)需要具備何種調性?(逗比搞笑?段子八卦?深度評論?一手資訊?文藝暖心?)內容從哪裡來?(UGC?PGC?)

  • 我的內容如何組織和展現?(專題?列表?分類導航?字體?字號?行距?段距?)

  • 如何在已有基礎上做出用戶更喜歡看的內容?(內容策劃?內容選題?內容如何借勢熱點事件和人物?)

  • 我現有的內容如何能夠更容易、更高頻地被用戶所消費?(內容標題怎麼寫?好內容如何推送給用戶?推送頻次如何?推送手段有哪些?EDM?站內信?Push?)

  • 我的內容生產如何可以具備持續性?(做活動?稿費?用戶激勵機制?其他利益交換?)

  • 如何更好地引導用戶來與我的內容發生互動甚至傳播內容?(製造話題?討論氛圍引導?傳播機制設計?)

2. 用戶運營

跟內容運營相似,所謂用戶運營這樣一個分支,其實核心要解決的問題,也是圍繞著用戶的新增-留存-活躍-傳播以及用戶之間的價值供給關係建立起來一個良性的循環,持續提升各類跟用戶有關的數據,如:用戶數、活躍用戶數、精英用戶數、用戶停留時間……等。

所以,用戶運營要關注的問題可能包括了以下問題中的一個或多個——

  • 我們的用戶該從哪裡來?(微博?豆瓣?廣告?BD合作?線下地推?人肉?現有用戶傳播?)如何落實?(BD?付費?渠道建設?產品機制設定?)

  • 用戶來了之後,我們如何建立和維護我們跟用戶間的關係?(多互動?多要反饋?多送禮品?多幫用戶解決實際問題?)

  • 如何讓願意留在這裡玩的用戶更多?(分析數據?關注留存?提升留存?關注活躍?拉昇活躍?用戶積分體系設計?用戶激勵體系設計?)

  • 當用戶量慢慢多起來比如達到幾百萬的時候,如何增強我對整個用戶生態的影響力和掌控力?(如何對用戶進行分類?針對每類用戶我們應該如何服務和管理?怎樣讓不同類型的用戶之間產生價值關係?如何構建起一個良性可掌控的站內用戶模型?)

  • 用戶如果出現流失怎麼辦?(分析流失原因?建立流失預警機制?召回?放棄?)該如何召回?(召回策略?EDM?短信?Push?)

3. 活動運營

至於活動運營,核心就是圍繞著一個或一系列活動的策劃、資源確認、宣傳推廣、效果評估等一系列流程做好全流程的項目推進、進度管理和執行落地。一個活動運營,必須事先明確活動的目標,並持續跟蹤活動過程中的相關數據,做好活動效果的評估。

其實,活動是一種再常見不過的運營手段,也是一個合格的運營必須要掌握和熟練運用的一種手段。往往在我們做內容運營和用戶運營的過程中,也必不可少的會涉及到很多活動。所以其實,單獨把“活動運營”設為一個獨立崗位的互聯網公司,其實並不是特別多。

基本上,一個公司可能會專門設置出來一個“活動運營”崗的典型場景,可能僅有兩種——

  • 該公司對“活動”的定位較高,會定期通過一些中大型的活動來拉昇某些核心數據或是宣傳公司品牌,而活動的策劃設計、執行確認等也通常比較複雜,需要專門有人來主Hold和跟進(類似支付寶集五福這樣的活動,就很複雜);

  • 該公司用戶已有一定用戶體量,為了做好用戶的維繫,需要定期策劃和落地一些活動。又或該項業務本身就需要持續不斷的活動來助推(好比電商網站,淘寶天貓等各種定期購物節)。

4. 產品運營

所謂產品運營,其實要做的事情,就是通過一系列各式各樣的運營手段(比如活動策劃、內外部資源拓展和對接、優化產品方案、內容組織等等),去拉昇某個產品的特定數據,如:裝機量、註冊量、用戶訪問深度、用戶訪問頻次、用戶關係對數量、發帖量……等等。

所以,一個真正意義上的“產品運營”,其實是一個綜合能力比較均衡,既熟悉各類運營手段,又熟悉產品,甚至能夠自己完成一些產品方案的人。

對於一家互聯網公司,會設置一個“產品運營”崗位的場景,以下兩種情況是比較典型的——

  • 一個比較成熟的產品新上了一個分支功能,在一段時間內需要一個人對接協調各種資源,幹好各種活,對該功能相關產品數據負責(如新浪微博上線了一個“微群組”功能);

  • 一箇中早期的互聯網公司,不需要對運營劃分得那麼複雜,就是需要有一個人啥都至少會點兒,啥都能幹,還能把產品養活起來,所以ta就成了“產品運營”……

2開源組件運營

開源組件的運營,實際和產品運營比較貼切;

前面系列文章比較了Cassandra和Hbase。Cassandra在國外用的相對廣泛,整體活躍度要高於hbase;和hbase在國內反而要火一些。

Cassandra最近兩年在大數據公司Datastax的大力培育下獲得長足發展,功能和性能均大幅提升,Datastax的估值也達數億美元。從apache cassandra首頁來看,大概有超過1500個公司在使用cassandra。其中除了facebook和twitter外還一些有代表性的公司列舉如下:

  • Instagram:inbox、newsfeed、 audit、fraud detection,12 EC2 node,1.2T,2w+ wps,1.5w+ rps;

  • eBay:200+TB,400+M寫,100+M讀,應用場景:商品詳情頁上的Social Signals,如Like,Want,Own,Favorites等;用戶和商品的hunch taste graph;時間序列如移動通知,反作弊,soa,監控,日誌服務等;

  • Netflix:包含288+96+60個實例的大規模集群,每秒110萬的寫操作,3個AWS EC2 美國東部region的zone自動複製副本,總計330萬寫操作/秒;

  • Apple:75000+ nodes, 10s of PBs,Millions ops/s, largest cluster 1000+ nodes。

從技術實現上來講,cassandra同時具備AWS Dynamo和Google Bigtable的設計理念,同時引入了P2P技術,具備大規模可分區行存儲能力,強調AP,實現了最終一致性,具備多數據中心複製支持,具備市場上最具有競爭力的可擴展性,無中心節點,一致性和時延可調,無單點故障,每個節點只有一個進程等等大數據存儲管理的先進特點,並支持spark、storm、hadoop的集成。但同時,Cassandra實現複雜性高,沒有相應的中文社區,文檔太少,國內應用和實踐太少,Datastax也未進入中國市場,因此在中國的推廣會比較困難。

眾多大數據開源組件裡面,相對來說,搞的相對比較好的是spark,mongoDB。搞的好,通常需要一個商業組織在負責和管理,純粹靠開源運作和個人興趣,是比較難的。可以先看一眼mongoDB的中文社區http://mongoing.com/webinar_cn,相比我前面講的hbase沒有一個共同的社區要好不少。

新數倉系列:開源組件運營(3)

開源運營通常的手段有:

1、有一個好的社區(用於用戶互動,不限於論壇,微信群,QQ群)。

2、好的資料;用戶手冊(中文手冊)、出版書籍、週報、日報等,幫助解決入門門檻問題。

3、線上線下交流活動(meetup,專家講座,summit等)。

4、成功的用戶案例。

5、ISV(雲應用市場,線下團隊)

6、最最重要的還是產品要好,要有一個廣泛的適應場景,解決客戶足夠多的問題,持續的演進和競爭力(低成本、高性能、穩定性、易用性),出了問題及時響應解決。

現在很多雲服務都是基於開源組件實現,做雲服務核心核心之一就是做生態,所以相比傳統的產品銷售,只靠產品特性打動用戶是遠遠不夠的。

產品決定的是長期競爭力,運營決定的是短期用戶體驗。雲服務領域,產品和運營,兩手抓、兩手都要硬!

為了方便大家相互交流學習,創建了一個公眾號同名微信群:《大數據和雲計算技術交流群》,人數已經2500+,歡迎大家加我微信。


分享到:


相關文章: