11.21 為了快速響應全球用戶請求,匯量科技選擇了上雲

“簡單極致,極具伸縮性,是我對AWS的理解。使用AWS,讓匯量科技能夠快速擴展、快速創新,從2017年到2019年,匯量科技的日均廣告請求量從180億次增長到500多億次,最高峰值達1000億次,我們的IT運維依然能夠從容應對。”

——匯量科技技術副總裁兼首席架構師 蔡超

為了快速響應全球用戶請求,匯量科技選擇了上雲

匯量科技技術副總裁兼首席架構師 蔡超

掛牌上市的創業公司

廣州匯量信息科技有限公司(Mobvista)成立於2013年3月,是一家全球知名的移動廣告及營銷服務技術平臺,專注於為全球應用開發者提供移動廣告及數據分析服務。

2018年12月12日,匯量科技在香港聯交所主板成功掛牌上市,股票代碼為1860.HK。2019年被中國互聯網協會、工業和信息化部網絡安全產業發展中心選入中國互聯網企業100強榜單。

截至2019年6月30日,匯量科技接入APP數量已經超過11,000款,覆蓋超過2,440個應用開發者。在截至2019年6月30日止的報告期內,匯量科技營收為15.5億元(2.25億美元)。

為了快速響應全球用戶請求,匯量科技選擇了上雲

業務背後的IT架構

匯量科技從成立之初,就採用All-in on Cloud的雲原生架構,基於AWS逐步建立起全棧式的移動廣告平臺,包括SSP (Supplier Side Platform,供應方平臺)、DSP (Demand Side Platform,需求方平臺)、AdExchange廣告交換平臺、以及DMP數據分析平臺,所有的業務應用都在雲端完成。匯量科技深入應用AWS上各種技術,例如數據存儲服務Amazon S3、NoSQL數據庫服務Amazon DynamoDB、數據庫倉庫服務Amazon Redshift、無服務器服務AWS Lambda等等,AWS新發布的技術,匯量科技都會第一時間去探索。

下圖為匯量科技的系統架構示意圖,使用的AWS雲服務包括Amazon Elastic Compute Cloud (Amazon EC2)、Amazon Simple Storage Service (Amazon S3)、Amazon Redshift、Amazon Kinesis、Amazon CloudWatch、Amazon DynamoDB、Amazon Relational Database Service (Amazon RDS)、AWS Lambda、Amazon EC2 Auto Scaling、Amazon Simple Queue Service (Amazon SQS)、Amazon ElastiCache等。

為了快速響應全球用戶請求,匯量科技選擇了上雲

匯量科技基於AWS的系統架構示意圖

選擇AWS的理由

一、對業務高速發展的有力支撐

自公司成立以來,短短几年時間,匯量科技業務快速膨脹,迎來了高速發展階段。日均廣告請求量從2017年的180億次,猛增至2018年的500億次左右。2019年,日均廣告請求量持續增長到600億次,峰值攀升至1000億次。與此同時,IT業務量也隨之直線上升,目前匯量科技所使用的服務器規模是之前的10倍左右。如此迅猛的業務成長速度和大規模的業務需求全部依託於雲上的應用。

匯量科技技術副總裁兼首席架構師蔡超表示:“AWS的表現總體超過預期。不僅能夠支撐業務系統快速擴展,加快創新速度,而且通過對AWS新技術的深入應用,整體可用性不斷提升,並使單次請求的服務成本降低了60%之多。” AWS提供雲服務的深度、廣度以及服務本身的穩定性、可用性和可擴展性很好地幫助匯量科技實現了從零到一的突破,從容應對大規模高速擴展的挑戰。

匯量科技的業務是遍佈全球的,如何以最快速度響應各地用戶請求,系統的全球化部署是一個非常大的挑戰。而且,系統的穩定性要求極高,因為流量高峰時常出現,瞬間的點擊量會急劇上升,這就要求系統能快速處理,具備非常好的可擴展性。受益於AWS健壯且廣泛深入的服務,使匯量科技能夠簡化運維複雜度,降低運維成本。業務發展至今,運維團隊人數仍然與2016年持平。

為了快速響應全球用戶請求,匯量科技選擇了上雲

二、面向雲原生的IT重構

2017年,隨著業務規模和IT規模一路高速增長,匯量科技的系統越來越複雜,IT投入也隨之增加。匯量科技開始考慮:如果按照如此勢頭增長下去,如何管理雲上的複雜性?如何優化和控制成本?

AWS上有很多超大規模的企業,例如Amazon.com、Netflix等。匯量科技認為他們的經驗非常有價值,尤其是在運用微服務和DevOps理念上。經過與Amazon.com進行對照之後發現,如果按照其應用架構進行改造,單次請求的成本至少可以降低40%。於是,匯量科技開始對應用架構進行全面重構。

重構的第一步是微服務化。當時,匯量科技的應用由一個個大型的單體系統構成,當需要進行擴展時,就是不斷克隆整個單體系統,比較粗放。通過微服務改造,可以在更細的粒度定位瓶頸,在關鍵的位置增加資源進行擴展。事實證明,微服務模式更適合雲原生架構。

微服務改造的同時,匯量科技還構建了面向錯誤、面向恢復的高可用系統,實施混沌工程。匯量科技希望做到,哪怕關閉系統中的任何一個實例,都不會影響整個系統的運行。接著,匯量科技又開始進行無服務架構的演進,通過使用Amazon DynamoDB、AWS Lambda等服務,進一步細化系統架構的顆粒度,在更微小的層面增強彈性伸縮能力,更大程度上簡化系統,降低運維成本。

為了實現低成本構建大規模雲上系統,除了以上最佳實踐的應用,匯量科技開始大量採用Amazon EC2 Spot實例,大幅節省成本。Spot實例是AWS開創的一種雲上計費方式。它以遠遠低於按需實例的價格(通常只有按需實例價格的10%-20%)提供資源,但是價格會根據供求關係的變化、以小時為週期實時調整。匯量科技充分利用Spot實例的特點,藉助其強大的彈性和可恢復性,在高可用的系統架構中大規模採用Spot實例。在確保整個系統穩定可靠的同時,大幅降低IT成本,成為在AWS上實現成本節省的典型客戶。目前匯量科技的整個在線系統中,70%的實例採用Spot實例。

經過以上改造,匯量科技單次廣告請求的IT成本較先前降低了65%。匯量科技2018年年報指出,服務器成本佔總收入的比例從2017年的4.4%下降到 2018年的4.1%。

為了快速響應全球用戶請求,匯量科技選擇了上雲

上雲之後的收益

對於AWS,蔡超給予了非常高的評價:“我個人對AWS的理解就是,簡單極致,極具伸縮性。使用AWS,讓匯量科技能夠快速擴展、快速創新。”

在支撐業務快速擴展方面,依託AWS全球覆蓋、海量強健的雲計算IT架構,匯量科技可以隨時滿足業務擴展的需求。匯量科技經歷了初創期、達到相當規模之後,業務擴展的勢頭依然強勁,IT運維都能夠從容應對。匯量科技基於Amazon EC2和Amazon S3的底層支持,構建了EnginePlus大數據計算中臺,對10+PB級數據進行分析和處理,為業務升級迭代打下堅實基礎。

在支持業務快速創新方面,2017年時,匯量科技的應用還是以SSP為主,到現在2019年8月,AdExchange廣告交換平臺、程序化購買(RTB)已經成為業務主角,是全球為數不多的有能力提供相關服務的供應商。通過使用AWS簡單極致的雲服務,為匯量科技解除了大量的運維負擔,簡化了應用開發和部署,從而加快了匯量科技的創新速度。

通過結合AWS的特點不斷優化升級系統架構,匯量科技搭建起了一套適合雲原生的業務模式,能夠以輕盈、靈活的方式應對業務的高速發展,同時有效釋放IT成本壓力,實現了單位請求服務成本降低65%的超預期目標。

目前,匯量科技正在進一步加大研發投入,將大數據計算能力、大規模機器學習能力和彈性集群管理能力充分應用於業務發展,引入人工智能技術進行深度學習,以更低的成本有效賦能程序化平臺的千人千面投放體系。

同時,匯量科技將以上能力沉澱為成熟的技術解決方案,逐步實現對外商業化。2019年7月,匯量科技成為AWS合作伙伴網絡(APN)的APN技術合作夥伴,其技術中臺產品SpotMax彈性集群管理中臺、EnginePlus大數據計算中臺和MindAlpha大規模機器學習中臺等產品和服務自今年8月陸續在AWS Marketplace上線,計劃依託AWS,以技術中臺為基礎拓展新的商業領域。


分享到:


相關文章: