阿里雲這10年:一幫人拿青春實現一個“飛天”夢

2019年,阿里雲成立十週年。

從最早被業務“逼”著開展這項業務,到如今成長為全球前三,中國第一的雲廠商,這10年它跌跌撞撞,經歷了無數困難。

在電影《當幸福來敲門》裡,威爾史密斯說過這樣一句話”你有一個夢想,你需要去保護它“。

回顧過去10年的發展歷程,阿里雲的這幫人就是用青春和行動保護了一個夢想,並且成功實現了這個夢想。

(1)王堅加盟

這個夢想是從一個人的加盟開始的。

2008年9月,王堅博士加入阿里巴巴。

馬雲把他從微軟亞洲研究院常務副院長的位置挖來,是因為阿里巴巴面臨一個緊急的問題——公司 “計算力”不夠用了。

當年用戶激增,數據越來越多,每天早上八點到九點半之間,服務器的處理器使用率都會飆升到 98%,距離系統崩潰就差兩個百分點。

阿里巴巴就像賽道上的跑車:速度飛快,但引擎已經發紅,再踩幾腳油估計就要冒煙,後果不堪設想。

怎麼辦?最簡單的辦法是,花錢繼續買服務器和軟件,但是有兩個問題:一個是太貴,另一個問題是不好用。

2008 年中旬,馬雲召開內部會議,決定要研發一套新的技術架構來換掉阿里巴巴的舊引擎。

於是,找來了王堅博士,而他的使命就是從零開始建立這個雲計算系統。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

王堅

王堅是個理想主義者,他希望新架構的每一行代碼都要自己來寫,並把這個想象中屬於中國的雲計算系統定名為“飛天”。

由於在自主研發飛天的同時,業務也不能停。因此,阿里巴巴需要同時做兩件事:一邊研發“飛天”系統,一邊用開源軟件支撐淘寶網的業務。

這就是集團的 “雲梯計劃”。

“雲梯計劃”做了兩手準備:用一些已有的開源軟件為基礎,研發一個數據計算系統,這是“雲梯1”計劃;而以“飛天”為基礎,純自研一套數據計算系統,被定為“雲梯2”計劃。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

2009年阿里雲成立

(2)招兵買馬

阿里雲正式成立還是一年之後的事情。當時,所有的人都是在一個叫做“阿里研發院”的部門裡工作。

要做“飛天”,第一步就是要找人。

滿弓是阿里雲的第六位工程師。入職合同當天下午,就被“附贈”了一張火車票——去天津幫助招聘。

滿弓這樣回憶十年前的那個下午:

“阿里研發院” 2008年10月才成立,已經錯過了招聘季的黃金時期。但是我們又確實太需要人才了,於是刻不容緩,要再掃蕩一下那些大學,把“漏網之魚”打撈回來

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

2009年阿里雲的招聘海報

跟著阿里雲的招聘隊伍,滿弓跑遍了全國主要的幾大城市十幾個學校。每到一個學校,只呆三天。

第一天做宣講,然後馬上筆試;第二天統一面試;第三天發 Offer。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

當時判卷的場景

經過這樣“連滾帶爬”的招聘,到了2008年年底,阿里雲湊夠了了三十位工程師。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

馬雲、王堅和工程師們的合影

一群來自五湖四海的飛天工程師們,鬥志昂揚,像打了雞血一樣,開始了研發“飛天”系統的征程。

但外邊的人,則一直用懷疑的眼光看著他們。

(3)飛天起步

飛天的第一行代碼,是在北京寫出來的。

2009年春節上班第一天,在北京上地的匯眾大廈203這間連暖氣都沒有的辦公室裡,一幫工程師一邊口呼白氣,一邊敲出了“飛天”的第一行代碼。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

飛天的第一行代碼

天氣冷難熬,天熱同樣難熬。

北京的夏天,驕陽似火。當時測試系統的服務器就架在辦公室裡,這就是個巨大的火爐。

大廈的空調不行,還沒到七月份,程序員就熱得撐不住了。為了降溫,每天上午他們都叫冰場送兩大塊冰來。

有一次週六,馬雲來北京,專門到阿里雲的辦公室去看看。阿里雲第一任技術總監林晨曦趕緊想打開電腦給馬老師展示一下自己團隊的成果。結果按了半天開關,機器都沒反應。

原因是大廈停電。

馬雲就這樣坐在辦公室等了半個小時,直到物業恢復供電才一睹阿里雲飛天系統最初的芳容。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

同事們往辦公室裡運冰

(4)“牧羊犬”陪練

在阿里雲創業的同一時刻,另外一個新的業務也在醞釀之中。

這個新項目叫做“牧羊犬”——阿里金融最早的一個業務雛形。負責這個新業務的人叫胡曉明,他在2005 年加入阿里,是金融行業的大咖。

2009年6月,馬雲找到胡曉明,準備交給他一個大任:內部創業,做阿里金融的總裁。但是條件是:業務必須第一天就跑在阿里雲上。

阿里雲這幫看上去瘋瘋癲癲的人,他們技術到底靠不靠譜,胡曉明心裡並沒有底。

胡曉明心裡不情願,但馬老師肯定有馬老師的道理,最後他還是答應了。

不過,胡曉明擔心的事情,還是發生了,而且還是頻繁發生。

“飛天”系統,由於不成熟,數據傳輸問題、計算穩定性問題、處理速度問題一樣都不少,各種 Bug 形式翻新,永不重複。

阿里金融的工程師也被害慘了,必須24小時盯著系統,才能防止系統運行出現差錯。

作為合作伙伴,領導研發團隊的林晨曦每天的表情都有點兒尷尬,出則滿臉堆笑地幫阿里金融排除 Bug,入則愁容滿面地和同事們一起修改代碼。

眼看就要過春節了,兩個項目都快撐不住了。

被“豬隊友”坑得夠嗆的胡曉明一氣之下帶著核心骨幹跑到阿里雲辦公室門口“討說法”。

無奈之下,阿里雲的技術工程師到阿里金融的辦公室加班開發,只為了“讓兄弟團隊能過個好年”。

好不容易捱過了 2009 年,春節過後,阿里雲發佈了一次大版本升級。這次之後,系統非常穩定,研發團隊一時都感覺沒有事兒做了。

阿里金融,成為了後來的網商銀行,就這樣無意間成為了中國第一個上雲的銀行。

而這一段經歷,也讓胡曉明跟阿里雲結了“緣分”。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

胡曉明負責的牧羊犬項目成為第一家上雲的銀行

(5)5K決戰

解決了穩定性,阿里雲就像抓住了一顆救命稻草,總算可以暫時喘口氣了。

但還有一個更大的難題,等待解決。那就是“雲梯計劃”需要有個抉擇——兩座雲梯只能保留一個。

取捨的規則很明確:

要想成功肩負起阿里巴巴的底層計算系統,就必須有能力獨自調度 5000 臺服務器。誰先實現這個目標就“贏者通吃”,繼承家業,成為全集團的業務系統。

而調度5000臺服務器這個目標,就是5K決戰。

王堅是一個性情溫和的人,平常都是笑容滿面。但是那段時間,他幾乎天天跟團隊拍桌子,希望儘早拿下5K之戰。

2012年底,以開源軟件為基礎的“雲梯1”計劃實現了4000臺集群調度,而阿里雲團隊更看好的純自研 “雲梯2”還在1500臺集群的數量徘徊。

這是阿里雲最困難的時刻,“飛天”進展很慢,根本看不到贏下5K決戰的希望。

很多人失去了信心先後離開了,部門的績效在集團也連續幾年墊底。而內部公開質疑阿里雲的聲音也冒了出來。

流言傳到馬雲耳朵裡。“我每年給阿里雲投 10 個億,投個十年,做不出來再說。”他對著阿里巴巴集團所有人,斬釘截鐵地說。

關閉的流言沒了,但5K的困難還沒有解決。

當時,5K之戰的局面變得有些尷尬:雲梯1和雲梯2都沒能實現5K的目標,但是這個時候,必須做出選擇,因為業務能夠給的期限非常短了。

2013年3月28日,一封來自集團技術保障部架構師雲錚的郵件直達高層:

按照數據增量與未來業務增長的情況,雲梯1和雲梯2兩套系統的存儲和計算能力將在今年6月21日到達瓶頸。到那時,數據業務將會停滯,很多業務都會受到影響;阿里金融的貸款業務將因為無法進行信用數據運算而中止。

距離Deadline只有三個月。

這個時候,必須選擇一個。此時做出任何抉擇,都會徹底改變阿里巴巴的歷史。

經過充分的討論之後,集團決定押注“飛天!”

最終,那些曾經看好或者不看好“飛天”的技術大牛加入到“飛天”的開發計劃中來。

2013年6月底,阿里雲的團隊們,最終實現了平穩調度5000臺服務器的目標,成為全球第一家擁有這樣能力的雲計算公司。

這意味著,“飛天”成功了。

阿里雲這10年:一幫人拿青春實現一個“飛天”夢

飛天5K

(6)阿里雲起飛

歷經5年,阿里巴巴在超高速行駛中,沒有踩一腳剎車,成功更換了發動機。

但是作為阿里雲的第一任技術總監,林晨曦並沒有看到5K決戰的勝利。他在2012年秋天,離職創業。

2014年秋天,胡曉明來了,成為阿里雲總裁。

他曾受夠了阿里雲的初創期的折磨。但是也正是因為這個磨合的過程,讓他看到雲計算的未來。

5K之後,阿里雲勢如破竹,隨後城市大腦、神龍雲服務器、POLARDB等自主研發的雲計算產品和解決方案不斷湧現。

與此同時,阿里雲的商業化也進入快車道,營收連續十多個季度實現100%以上的增長,成為中國第一的雲計算廠商,還成功走向了海外市場,躋身全球前三,跟亞馬遜、微軟等老牌科技企業展開全球競技。

2018年4月,飛天雲計算操作系統獲得了一個特別的獎項——中國電子學會15年以來的第一個特等獎。這可以說是“飛天”系統具有重大意義的又一個註解。

2018年11月底,阿里雲事業群升級為阿里雲智能事業群,阿里巴巴集團首席技術官張建鋒(花名:行癲)兼任阿里雲智能事業群總裁,目標是構建數字經濟時代面向全社會基於雲計算的智能化技術基礎設施。

可以說,面向未來10年,阿里雲又到了再出發的時刻。

人的一生有多少個十年,阿里雲的一幫工程師前赴後繼,用十年時間撰寫了一個有關“飛天”和雲計算的精彩故事。這個故事值得那些參與其中的人,一輩子來銘記和回味,因為這是夢想成真的故事。

面對波瀾壯闊的雲計算浪潮,阿里雲新的10年又開始啟程了。


分享到:


相關文章: