12.05 談及未來的 AI, 也許你已身處其中

談及未來的 AI, 也許你已身處其中

AI(人工智能)一詞,可能早已經爛大街了,說起它,橋下貼膜的小哥也能和你說出個一二三來。這是一個玩笑,但也說明 AI 的火熱。而 AI 技術以計算、數據、算法為三大基礎,若沒有云計算產業的成熟,AI 必然不可能發展到今天眾人矚目的格局,因此對於 AI 現狀的研究,必然繞不開雲計算產業。

近日,InfoQ 旗下「AI 前線」採訪了我們的聯合創始人林源(Spencer Lin),林源從他的角度闡述了 AI 在 2017 年的發展情況,以及支撐 AI 產業的雲計算產業在 2017 年的發展情況。

AI 未來怎麼樣,Spencer 的這篇採訪也許會給大家帶來一些啟發。

談及未來的 AI, 也許你已身處其中

林源(Spencer Lin),青雲 QingCloud 聯合創始人,本科和碩士就讀於清華大學,畢業之後一直從事分佈式和底層系統的開發與研究工作。創建 QingCloud 之前,曾在 IBM 參與 Hadoop 相關的研究和優化項目;2010 年加入騰訊搜索的圖片搜索項目組,參與圖片搜索的相關性算法研究與開發、海量圖片分析和挑選等工作。聯合創建青雲後,林源承擔了數年首席架構師的工作,目前擔任青雲的產品總監兼運營副總裁。

InfoQ:首先,請您簡單介紹一下你們在今年達成的主要目標?

林源:產品構成方面,我們在年底會發布三款新產品。基於這三款新產品的發佈,我們在底層架構上已經相對比較完整了,因此我們提出了「全模雲」的理念。

三個產品,一個是我們的物理主機,就是青雲除了交付虛擬主機和容器主機之外也可以交付物理主機資源;

第二個是 NeonSAN 共享塊存儲,它通過 Server 集群代替傳統存儲櫃的功能,同時可以給到虛擬主機和物理主機去使用,非常適合 Oracle RAC 等需要偏傳統架構來支撐的業務。這兩個產品讓我們可以更好的去支撐企業的穩態業務。

第三個產品 RadonDB 分佈式數據庫,它比較適合傳統客戶的傳統業務向互聯網業務轉型的場景。比如我們一個保險行業客戶,他們在感恩節這天提交的訂單可能是平時的 double commission 或者 triple commission,比平時多很多。這個業務原本可能是基於 Oracle 做的,但是 Oracle 其實是不太支持這種搶購的場景,所以我們提供的 RadonDB 分佈式數據庫就是應對客戶的這一類需求,就是傳統客戶的傳統業務不用經過太大的變動就可以上雲的這個需求。

InfoQ:你們現在營收的來源比例如何?

林源:從業務構成來說,青雲當前有五塊主要業務:公有云、私有云、混合雲和託管雲,以及骨幹網。今年來說,骨幹網的業務增長是比較快的。從骨幹網客戶的行業構成來看,互聯網金融客戶是佔比最大的,包括泛金融領域如保險證券這些領域的客戶,他們今年的互聯需求比較多。

骨幹網要解決的是端和雲互聯的問題,這個端可以是終端設備,也可以是機房。骨幹網首先要解決的是資源的問題,但是目前資源是已經存在的,但是缺乏互聯。在這種情況下,我們需要跟專線供應商打交道,比如做煤氣管道的公司、做高速公路的公司,以及在每個城市的專線供應商,因為可能每個城市都有不同的公司在本地掌握比較多的資源。另外一個需要解決的問題是調度能力,這個是比較有技術含量的,所以這個需要我們來做,我們會加入我們的智能控制節點和控制邏輯,把這些網絡資源調度起來。

2015 年,我們建成骨幹網的北京節點;2016 年,我們建成上海節點;2017 年,我們建成廣東節點以及小規模的亞太節點,所以現在我們自己在四個地區有自己的骨幹網節點,在其他地區就用合作伙伴的節點。有了骨幹網之後,客戶的體驗跟以前是很不一樣的,我舉兩個例子。

一個是我們在西藏的一個客戶,他們需要跟北京做互聯,也需要跟在深圳有合作的銀行做互聯。傳統做法是什麼?西藏到北京、西藏到深圳分別拉光纖。現在的做法不一樣了,西藏的客戶可以連到我們在西藏的合作伙伴的節點,深圳的銀行可以連到我們在深圳的骨幹網的毛細血管節點,這兩段連接我們找資源提供方讓它做最後一公里的對接就行,其餘的對接我們跟我們的合作伙伴都已經做好了。

第二個是銀行要做掌上生活這樣的互聯網業務,在每個城市都要提供服務。以前他們也能做到,但是很痛苦,因為要跟運營商一個一個談合作——談好了線路、實際運營之後才發現帶寬不足,例如做秒殺和推廣的場景——這個時候還得和運營商提交申請,這完全不是一個技術問題,下單之後可能要有層層審批,要找關係,一家不夠還要找多家,要做冗餘,諸如此類種種問題。但是有了骨幹網之後,用戶可以自由靈活的對使用的資源進行細粒度的控制和調度,

按需使用,按需交付,用戶使用骨幹網就會和現在使用雲資源一樣的方便

骨幹網,我們叫做連接資源,跟機房裡的計算資源一樣,需要用技術把它更好的抽象出來、交付出來。所以青雲說白了就做兩個事情:交付雲、交付網。我們做的就是這些底層的髒活兒、累活兒。骨幹網業務今年上漲得很快,因為客戶的需求確實很高。

InfoQ:自建骨幹網在成本方面會不會很高?

林源:其實也不一定需要投很多錢。雖然我們的確自建了幾個點,投了很多錢,但更多的資源不需要我們去投,我們有合作伙伴。就好像我們不需要去投建 IDC 一樣,因為中國遍地都是 IDC。現在 IDC 都在轉型。專線供應商也是一樣。

InfoQ:青雲在 2012 年開始做的時候,那時候說做雲計算,主要就是說計算、存儲、網絡、再加上安全四個大的組成部分。現在再看雲平臺的發展,產品種類更多了。您感覺這個過程中最大的變化是什麼?最大的不變是什麼?

林源:我們專注的事情是我們交付資源的能力,我們的核心是我們的資源調度的能力,在這個能力裡面我們會不停的去深挖,去演進。

公有云上線的時候 SDS(軟件定義存儲)是 1.0 版本,到 2.0 版本有一個很大的變化,這是來自容器的興起,要面對一個新型的場景。我們認為容器跟虛擬化是一個互補的關係,1.0 的架構只能去運行虛擬主機,2.0 的目的就是要同時支持虛擬主機與容器主機,所以它需要底層的變化作支撐。也不能說容器就一定是 Docker,或者一定是 Kubernetes,因為時代是要變化的,它現在火,可能哪天你看可能又不火了,但是你要看到這些不同的都有應用場景,就好像現在還有人在用物理主機,它們是互補的關係,所以我們就都得支持。

網絡我們也有一個從 SDN 1.0 到 SDN 2.0 的變化。1.0 我們大量用了 OVS 的技術,你會發現用戶規模上來之後性能就很差,這是圈內人都知道的事情。所以 2.0 我們就把 OVS 給摒棄了。

不變的事情是,我們還是去交付基礎設施的能力。變化的事情是用戶的需求,他對你底層的能力要求會越來越高,我們會不停隨著用戶的需求把青雲變得更加豐富。

用戶的視角也已經變了。兩年前談業務,用戶會問你虛機什麼價格、存儲什麼價格、帶寬什麼價格。現在談業務,用戶會說我想做一個風控業務,你能不能給我一個解決方案?你有沒有什麼 AI 的算法?這就到了業務層面。但你會發現越往上的業務層,每一個行業的語言都不一樣,青雲做不了這麼多行業的東西。

所以 AppCenter 對我們來說是很重要的事情,非常重要,這是未來。在未來,青雲的客戶看不見青雲,他們消費的是我們合作伙伴提供的服務。這些服務在青雲的平臺上會以 App 的形式去展示,但客戶如果直接從合作伙伴那裡得到服務,其實也不需要知道青雲有個 AppCenter,甚至不需要知道有青雲的存在。

InfoQ:能否介紹一個 AppCenter 比較成功的合作案例?比如有沒有 AI 方向的?

林源:可以。我們有個客戶是一個交通集團,他們其中一項業務是高速公路的收費業務。以前的收費模式很簡單,就是一進一出一收費,這樣每個收費站自己獨立計費就好了。但是現在要改革,不能再這樣粗粒度的計算費用,而是要精確按照每輛車的路徑來收費,這就要求把收費站都串成一個系統,而且要有智能識別的能力。

他們從兩年前開始用青雲的公有云,我們幫它做了很多功能,比如圖片存儲,他們每天的流量有兩百萬的車輛,哪怕只算一進一出,每天也會有四百萬張圖片放在我們的 QingStor™ 對象存儲裡面。

但是這些圖片我們只能存儲,那些車牌識別、車輛外觀識別、駕駛員人臉識別的能力,我們提供不了,或者說我們不願意自己有這個能力。那在這個領域,商湯、Face++ 等都是我們的合作伙伴,所以我們會把他們的能力跟我們的存儲對接起來,然後這個能力可以通過兩個平臺來提供給客戶。一個是放到 AppCenter 裡面,通過商湯、Face++ 的界面去使用;還有一個就是可以變成我們存儲的開放框架裡面的一個附加功能,把圖片存進去,取出來的時候自動調用接口,就會在給我圖片的同時給我一個結果。

這是一個三贏的結果。我們相信這個社會一定是多元的,每個人都有他的價值,每個公司都有他的價值、他的細分領域,每個人做事都要專注。

上回有個合作伙伴跟我說,說覺得我們的思路是有問題的,數據一定要抓在自己手上,他說一定要有數據,因為數據就是金礦。

我們知道數據是金礦,但是為什麼我們作為一個工具的供應商要去碰客戶的數據?我們要保持中立性。如果我們的合作伙伴是給客戶提供數據挖掘服務的,那麼他可以去碰這個數據;但我是提供計算和存儲能力的,這個事情一定要分開,要不然說不清楚,我又當裁判又當運動員,就會讓客戶很沒有安全感。所以這就是我們金融客戶很多的原因。客戶越信任你,才會把更多的業務放上來。做企業不要貪婪對不對?我覺得這是人最應該去控制的一個慾望。

算法,我們也不直接提供,我們提供算法平臺。我們能做完所有的算法嗎?不同的行業有不同的算法,我沒有這麼多的人去做。這是我們做 AI 的一個理念。

我們招 AI 的人才,除了更多的支持好合作夥伴的 AI 應用之外,更多是為我們自己內部服務,比如我大規模的數據中心,需要更好的優化自動化運維繫統的穩定性。

InfoQ:介紹一下你們現在內部使用 AI 的情況?

林源:

目前我們的 P2P 機器人更多的還是自動化運維,就是用相對固定的邏輯去處理那些已知的錯誤,基本上 90% 的常規故障都能覆蓋。智能化是去解決那剩下的 10% 的事情,要能夠去預測那些非常規的故障,也是目前比較熱門的 AIOps 的概念。

這個目前我們也在做,我們線上的服務器也有一定的規模了,我們正在把這些服務器的日誌收集起來做分析,並從這些日誌分析中更快地發現和定位異常。在這個工作過程中,我們也會引入合適的合作伙伴來合作。這一套工具除了給我們自己使用之外,我們還會交付到我們應用中心中,給我們的客戶使用,因為有一些比較大規模資源使用量的客戶也遇到類似的需求。

InfoQ:你們對於現在市面上的各種機器學習框架是什麼看法?會把哪個框架作為青雲平臺上的一等公民嗎?

林源:我們對 TensorFlow、MXNet、Torch 這些都會去兼容,不會特別傾向於哪一個,因為我們不是要去幫客戶做決策,我們要更通用,不同的用戶需要的不一定是同一個框架。

InfoQ:那麼在硬件芯片層面,你們現在已經推出了 GPU 集群。是否在考慮引入其他一些新的硬件?

林源:GPU 我們現在只能用 NVIDIA 的卡,因為 NVIDIA 的開發生態最好。但 Nvidia 家的卡確實貴。從我們的角度,GPU 業務的用量還是比較小的,沒有看到很大的增長,當然這可能也跟價格有很大關係,畢竟 AI 的計算在 CPU 上也是可以跑的,GPU 主要是在一些特定的場景可以加速計算。

像 FPGA,我們未來也會提供,這裡更多的是用戶需求的考量,比較目前它沒有 GPU 那麼容易被大家接受。其實我們不會做太多的“跟著熱門走”的事情,因為我們有盈利的壓力。不是說技術能達到的事情我們都要去提供。

其實跟合作伙伴合作也是這麼一個原則,比如 AppCenter,直觀的想法可能是 App 越多越好,這樣顯得生態很大對吧?但其實不是的,你要換一個角度去考慮這個問題。你跟一個合作伙伴合作,最終的目的是要幫他賺錢,是要滿足我們客戶最急迫的需求。不能說客戶火急火燎或者信心滿滿的上來,結果讓他很灰心很失望。必須讓他第一次就感到很滿意,這個很重要。

InfoQ:拋開青雲的立場不談,您個人怎麼看待今天整個 AI 業界的發展趨勢?

林源:對於 AI 的整體趨勢,我現在感覺好像更多是帶著技術去找場景。我現在去參加 AI 的一些展會,感覺千篇一律都那麼幾個場景——做機器人的、智能音箱、智能手錶,美國可能自動駕駛還多一些,然後圖像識別、語音識別、金融反欺詐這些場景。總的來說,能落地的場景還不算特別多。

理論上,AI 是能照顧所有行業的,我覺得現在 AI 還沒有被廣泛使用是因為它的體驗還太差。比如一個語音助手,應該可以任意的做斷句,助手需要去理解我,而不是我在那裡一個字一個字的說完之後它說它不理解。

現在 AI 在固定場景還是可以的,比如車輛識別的準確率還是很高的,但是像這種 to C 端的體驗,我覺得 AI 可能不會這麼快成熟。

但我覺得技術一定是在進步的,就跟我們在 2012 年做雲計算一樣,不是說 2012 年技術不成熟我們就不應該去做雲計算,我們是應該去做的,但是我們沒有辦法讓所有的人在 2012 年去接受雲計算。這就是我的觀點,就是很多時候它做得不夠並不代表這個趨勢不對。AI 現在的情況就是炒得很熱,但是很多底層很多沒有配套,你會覺得它上層強壯但是底層薄弱。

現在大量的資本流入這個行業可能會催化很多的泡沫,畢竟投資人的投資都要有預期回報的,如果場景不是很多,無法支撐一個很好的現金流、很好的盈利點的話,可能很多的創業公司就堅持不下去。當然,有資本流進這個產業,總的來說是件好事,畢竟有資源才有可能做成一些事情。

InfoQ:您覺得你們現在的客戶們面臨的最主要的技術挑戰有哪些?

林源:之前有一個很大的挑戰就是傳統業務上雲的運行問題,因為傳統業務跑在那樣的傳統硬件環境上,雲都是分佈式的架構,跑起來總覺得比較彆扭。我們推出全模雲,就是希望能解決這個問題。

另一個比較大的挑戰是,上了雲之後,IT 管理方式就跟傳統的 IT 管理方式不一樣了,需要新的 IT 管理方式。所以今年雲管平臺也挺火,就是把這些虛擬資源、硬件資源等異構資源統一的管理起來。第一件事是能在一個界面裡面看到所有的東西,第二件事就是要聯動不同角色的人,每類角色能看到不同的視圖——比如可能業務部門進來可以看到業務運行的情況、落在哪些集群上面、底層某個故障影響到哪些業務,基礎設施部門進來就能夠看到網絡流量監控、虛機監控、物理機監控等等。

另外就是,以前傳統業務可能半年才迭代一次,現在可能一個月、一週就有一個迭代,這也是一個很大的挑戰。

IT 管理的問題,其實公有云也面臨一樣的挑戰,就是管理界面要更好用,管理賬戶的二級權限、三級權限的劃分要更清晰,我怎麼去支持客戶作為一個賬戶購買服務、登陸進來,能夠實現他的管理需求。就是說,現在的問題不是說我怎麼去支撐客戶的業務,而是我怎麼去支撐客戶的管理。

InfoQ:就青雲自身而言,現在面臨的主要挑戰又是什麼?

林源:現在的青雲,產品很多,有幾十個,而且都更新得很快。我主要思考的第一個挑戰就是,我怎麼在研發層面把控,確保每一個產品最終都能去滿足客戶的需求?

第二個挑戰就是,這些產品做出來了,怎麼能夠用客戶能理解的語言去傳遞這些產品能夠提供的價值?可能客戶就提了一個很簡單的業務需求,但這個需求可能就要用到我們的雲管平臺、骨幹網、我們在某個城市的合作伙伴的資源等等,那我們就要有打包解決方案的能力給到客戶,這對人的要求很高,既要了解每個產品的核心是什麼、邊界在哪裡、跟哪些產品之間有怎樣的關係,還能讓客戶明白這個事情是做什麼的。應該說這是做 toB 業務都會面對的挑戰吧。

未來「船票」:聽林源說「全模雲」,不如自己看!12 月 12 日,青雲QingCloud 下一代企業級雲架構 ——「全模雲」線上發佈會,屆時將揭曉:同時具備雲特性(彈性、敏捷性、擴展性)與物理設備高性能的架構。

http://t.cn/RYAz05V


分享到:


相關文章: