雲知聲CEO黃偉:IoT 時代,我們爲什麼必須要做晶片?

7月6日,由創業黑馬主辦的“ 2018 中國獨角獸峰會”在京舉行,雲知聲 CEO 黃偉出席活動並發表主題演講。

云知声CEO黄伟:IoT 时代,我们为什么必须要做芯片?

黃偉在演講中表示,我們雖然進入到IoT時代,有一個可以預見的美好未來,但是離真正落地還有很多現實問題需要解決。其中芯片在整個IoT的進化過程中起著非常重要的作用。獲得了C輪1億美金融資後,不久前雲知聲推出了自研的面相物聯網的AI芯片——“雨燕”。

談及 AI 芯片,黃偉認為只有具備全棧式的 AI 技術能力,已經過驗證的、成熟的業務場景和一定的芯片設計能力,三者結合在一起,才有可能真正的研發出一顆有競爭力的芯片。

· PC -移動互聯網- IoT 的時代演進

我有幸經歷過中國互聯網發展的前兩個階段:上大學時我第一次接觸 PC ,第一次上網是畢業前去網吧,那時打開一個網頁需要幾分鐘,上網一個小時需要 10 塊錢,差不多是我兩天的生活費。 2009 年,我離開服務了六年的公司摩托羅拉,加入盛大網絡,從學生到工程師,完成了我人生的第一個轉變。那是中國 PC 互聯網的一個高峰。

緊接著從 2010 年開始,我們經歷了中國從 PC 互聯網到 Mobile 時代。我們看到中國第一代互聯網公司的市值從 10 億美金左右,翻到 Mobile 時代的阿里、騰訊的幾千億美金。我們也經歷了蘋果從一個 80 億美金的市值,到今天為止也成長為大幾千億美金的公司。

這期間發生了什麼?以前全球只有幾億臺的設備數量,到現在每個人有一臺手機、Pad ,移動設備呈現出指數級的增長。以前我們只能在辦公室、家,甚至只能在網吧上網、打遊戲,今天我們坐在馬桶上就可以完成一個遊戲的支付。這種設備數量以及技術環境的轉變,使得今天我們整個生活方式和社會組織方式都發生了深刻的變革。

今天在發生什麼?我們又開始從 Mobile 時代開始進入 IoT 時代,它不再侷限於手機、平板,比如像前面暴風馮總介紹的, TV 也可以上網、互動,甚至你們家的燈泡、音箱都是你跟這個數字世界進行交互的一個接口。

我們也不再只是通過手機的按鍵輸入,而是完全可以直接說話,可以對著攝像頭做出一些交互的操作。從一個數控時代,開始進入到包括了語音、手勢、體感等多模態的交互的任意場景。當然和以前相比,設備數量可能會更大。我們相信這個地球上很快會誕生萬億美金的公司,即使在今天有中美貿易戰的情況下,這種趨勢還是不可逆轉的。

· IoT 時代的機遇與“雲端芯”落地

首先,功能會更加智能化,不再只是通過手、嘴巴、眼睛等等。其次,場景化會更加豐富,在家、辦公室、汽車等任意場景,我們都能夠跟這個世界進行交互,當然設備也變得更加多元化。

我們描述了一個非常美好、偉大的未來,但是離真正落地,還有很多現實問題需要解決。首先我們今天的技術怎麼實現一種自然的交互?怎麼能在這些場景裡面滿足用戶的體驗?因為每個場景必然有它的獨特屬性,我們能不能在這個場景裡做非常好的適配?這些產品並非靜止,也不是交付到用戶手裡這個過程就結束了,我們如何運營、提升用戶體驗?

另一個很大的不同是價格。手機、平板動輒幾千塊錢以上, IoT 設備本身是幾百塊或者是一千塊錢左右,你怎麼樣用一種用戶能夠接受的方案成本交付給你的客戶?當然還有周期,怎麼能夠用更快的時間、效率交付給客戶?這都是我們今天在講 IoT 想要落地,擺在眼前的幾個困難。

2014 年初,我們第一次對外提出“雲端芯”一體化的解決方案。因為我們相信人工智能絕對不只是發生在雲端,除此之外,一定有邊緣智能,而且想要滲入到每個場景,對端一定會提出很多個性化的需求。所以,我們希望通過雲端來解決智能終端的一些智能化、場景化的問題。當然我們也希望通過芯片,能夠加速 AI 落地的問題。

前面松鼠 AI 智適應教育創始人慄浩洋講他在 2014 年融資非常困難,其實我相信在中國所有技術創業的團隊一開始都會遇到這種問題。因為 2012 年、 2013 年,那時候的資本都在投 APP 、產品創新,沒有人去投技術。所以很早之前,當我們說人工智能離不開芯片的時候,也遇到很多挑戰和置疑,大家不認為芯片非常非常重要。甚至我記得在 2016 年,中國有很多資本在國外收購芯片公司,我們說芯片是高端製造業,芯片是夕陽產業,但今天我們會發現沒有芯片我們什麼都不是。

今天回過頭來看,人工智能真正落地,它的痛點是在哪裡?沒有英偉達就沒有深度學習,沒有英偉達提供的 GPU ,我們不可能開發出非常複雜的深度學習網絡。沒有一些低成本、低功耗的芯片,我們不可能賦予智能設備一些本地職能能力,所以芯片在整個 IoT 的進化過程中起著非常重要的作用。

在我們的認知裡,IoT 的擴基點在於芯片,首先在於場景的選擇。因為 IoT 有很多場景,選擇就變得非常有技巧,哪些場景是用戶真正需要的,哪些場景是今天我們的技術能力滿足需要的。

第二,有了場景以後,我們就知道這個場景需要什麼能力,我們應該提供什麼樣的芯片,當然有了芯片以後其實我們可以加速 AI 在這個場景裡落地,其實他是一種正向的循環。 AI 芯片也並不是說今天有 PPT ,明天芯片就能做出來,或者說今天開個發佈會,6月以後我的芯片就出來了。毫無疑問,做任何事情都是有前提的,過去幾年我們的體會是什麼呢?AI芯片的製造有 3 個前提,只有當三者合在一起的時候,那麼我們才有可能真正的研發出一顆有競爭力的芯片。

1、你必須要有全棧式的 AI 技術能力。

2、一定要有已經經過驗證的成熟的業務場景。

3、 AI 芯片它也是芯片,所以說還要具備一定的芯片設計能力。

云知声CEO黄伟:IoT 时代,我们为什么必须要做芯片?

從 2012 年 6 月份成立,雲知聲在這一塊也積累了一些優勢。一開始我們完成了算法平臺化的過程。成立了 3 個月之後,我們發佈了國內第一個免費開放的語音平臺,緊著在 2012 年 12 月 12 號,我們買了 4 個英偉達的語音顯卡。在可能學術界 95% 的教授都沒有聽說過什麼叫深度學習的時候,我們就已經開始了。

今天回過頭來看,這三件事情非常重要。平臺意味著數據;深度學習意味著我們確定了整個算法的框架;當時一個很簡陋的 GPU ,意味著我們在那時就開始了對計算能力的追求,到今天我們的計算能力已經接近1000個 GPU 。

這是我們第一個階段。另外,在發展過程中我們發現,人工智能對計算能力的追求是永無止境的。今天我們可能說自己研發機房的 GPU 已經是以千個 GPU 為單位,包括我們在廈門市政府落地的一個城市大腦的超算平臺,每秒的運算能力能達到1億億次。這就是我們金字塔最底層的 DeepFlow 集群,它相當於給我們人工智能修了一條高速公路。

那麼有高速公路之後,我們會面臨另外一個挑戰。就像前面馮總說的,電視數據化看起來很簡單,其實上面涉及到很多環節,包括信號處理、包括麥克風、語音識別、自然語言理解、語音合成,包括像前面我們主持人和機器人的對話,它通過一種高表現力的合成效果把聲音播放出來。

因為人才和熱點的關注度還不在這方面,就深度學習來說,你會發現這在 2012 年、 2013 年這個時間來說是不可能現實的。那我們怎麼辦呢?很簡單,運用 AI 來做 AI 人才該做的事情。所以,我們在 2013 年啟動了一個項目叫 Atlas 平臺,把統計學習和深度學習裡面的一些通用算法抽樣出來。雲知聲有自己的 DeepFlow 集群,相當於在高速公路上有一臺馬力非常強勁的跑車。在這個時代,你有高速公路,有很好的跑車,你不需要很多司機。正是這樣,雲知聲作為一個創業公司,才能非常高效地在語音識別、語音合成等很多技術裡,迅速做出國內最頂尖的技術水平,這是我們在一些基礎技術上的積累。

雲知聲比較早的把這個技術深入到場景裡面去。我們有什麼產品形態?舉個例子,在 2013 年底、 2014 年初的時候,我們開始拿出一個芯片模組的原型,希望能用這種產品形態改變今天智能家居的一個應用模式。大家回想一下,在 2013 年底,其實我們看不到 echo ,它是在 2014 年底才出來,但我們在那個時候就開始做這樣的事情,到今天我們的芯片模組應用在包括格力、美的、長虹等幾乎所有頂級家電品牌中。

所以,在算法、硬件以及場景層面,我們做了非常具體的工作和長期的積累。 2015 年 8 月,我們組建了芯片團隊。到今年 1 月 15 號,我們自己研發的芯片正式流片, 5 月 16 號正式發佈了芯片“雨燕”,下個月即將大規模量產。

有了芯片之後,給我們帶來了哪些改變?我們的計算能力是目前市面上通用芯片的 50 倍以上,而且在端這一側積累了很多能力之後,我們可以把一些人機交互的共性部分放到芯片裡面,不光是語音合成、語音識別,甚至包含我們認為非常複雜的自然語言理解,相當於我們完成了人機交互的最共用部分。

那麼,雲端我們去對接的各種技術服務和內容服務等等,在端這一側,我們完全把源代碼開放出來,交給我們的合作伙伴、交給渠道。這樣雲知聲我們就完全進入了“雲+芯”時代。在不久的將來,大家會看到我們中國產的車裡面,我們用的芯片裡面,是由雲知聲提供。

· 我們為什麼做芯片?

我們為什麼做這個芯片?有一句話是說,“如果你嚴肅地思考你的軟件,你就必須要做自己的硬件”。

最底層的硬件是什麼?就是芯片,因為它能夠實現算法和算力的完美結合。當然芯片它其實並不是競爭,不是一味的追求說我這個芯片有多少。芯片它是個生態,追求的是一種平衡,你要平衡好計算能力、成本、功耗,只有深入場景,瞭解行業,才能夠真正定義好這個芯片。

我們今年是百箱大戰,但是所有的音箱裡面,它裡面所用到的和遠場語音交互的,都是一套模組,要用若干個芯片來實現這樣的功能。

第一,今天雲知聲可以用一個芯片接上2個、4個、6個、8個麥克風,就能實現我們今天所有的功能,體驗會更好,因為這個芯片的計算能力要遠遠超過今天市面上一些芯片的計算能力。

第二,更低的成本、更低的功耗。當然這個芯片我們也可以直接放在一些控制類上面,它既可以離線控制,也可以在線。

我們不止是講個故事,也不是說停留在算法層面上,而是把算法和行業結合在一起。比如在家居、教育、醫療、汽車、機器人很多領域裡,其實我們都取得了一些不錯的成績。

就拿醫療來說。2015年,當我們想把AI和醫療結合起來的時候,中國的任何一家醫院,任何一個科室,沒有一個醫生是用聲音來寫病例,但是今天我們在中國很多醫院,包括像今年衛計委還專門出臺了文件,我們中國所有三甲醫院的評級標準是必須要有這個語音錄入的病例。

我們非常高興能看到,雲知聲雖然是一家創業公司,但是通過我們的努力,我們改變了醫院,改變了行業。

---------------------------------------------------------

1.本文援引自互聯網,旨在傳遞更多網絡信息,僅代表作者本人觀點,與本網站無關。

2.本文僅供讀者參考,本網站未對該內容進行證實,對其原創性、真實性、完整性、及時性不作任何保證。


分享到:


相關文章: