傅盛:語音交互 將顛覆手機的中心地位

11月8日,獵豹移動董事長兼 CEO 傅盛出席第五屆世界互聯網大會“物聯網:連接無處不在”論壇,並發表題為《真開放·全鏈條AI技術賦能物聯網》的主題演講。

傅盛表示,<strong>即便是在今天的生產線上,也很難解決設備智能化的問題,而AI讓機器第一次擁有了人類的感知能力,也讓物聯網終端更聰明。這是一個巨大的分水嶺,使得AIoT的概念開始出現。在行業和自身的變革背景下,獵豹移動攜旗下人工智能公司獵戶星空,研發了包括語音識別、視覺識別、室內導航平臺等在內的行業唯一全鏈條AI技術。

他說到,“<strong>我們未來不會單做一款硬件,我們致力於打造AI賦能的雲端操作系統,跟開發者一起做更多的物聯網設備。”

傅盛表示,真正的語音操作本質是實現了命令的自然化。喬布斯有一句話說,每一次交互操作的演進都是一次革命。蘋果有幸抓住了兩次革命,第一個是抓住了鍵盤和鼠標,第二個是抓住了觸摸屏。

他認為,今天的手機不是因為它有多麼智能,而是因為它有強大的處理能力,你可以非常方便地touch。所以手機立刻取代了以前的PC、電視,成為了你的中心位置。<strong>語音使得手機的中心位置有可能被顛覆掉。雖然手機還是個非常關鍵性的設備,但下一代設備都可以變得去手機化。

iPhone剛出來的時候,大家說這個沒有全鍵盤、沒有硬鍵盤怎麼用,輸入內容太慢了。但就是因為它方便,你可以容忍它非常多不夠快速的地方。“語音是下一代操作系統的界面,它一定可以使得物聯網的很多設備變得智能。”傅盛說。


傅盛:語音交互 將顛覆手機的中心地位


首先,我花一點時間介紹一下獵豹移動。獵豹移動是一家經歷過三次跨越的公司,2010年由我自己創辦的可牛影像和金山安全合併而成。

當時我們經歷的第一波是PC殺毒軟件免費化,實現了第一次的增長。

第二波在移動互聯網的時候,我們碰到了強大的對手,決定出海。我們是第一家大規模的把用戶做到海外的中國公司。今天,獵豹移動大概有5億多的月度活躍用戶,其中80%來自於海外,完全走出了一條不一樣的曲線,我們內部叫做“天外飛仙”。所以我們現在依然是Google工具排行榜的第一,我們遊戲的下載次數在全球接近20億次。

第三波是在2014年上市以後。我當時就意識到,整個移動互聯網的風口將盡,我們需要尋找下一個機會。我們在硅谷、以色列都投資了基金,由此看到了人工智能的機會。

<strong>AI讓機器擁有感知能力 全力以赴打造全鏈條AI技術

我對人工智能有一些自己的理解和思考,我們講了很久的物聯網、智能硬件,其實在AI或者人工智能出現之前,所有的智能硬件都是偽智能硬件。那個時候的智能硬件本質上是聯網硬件,你要掏出手機進行操作。大概在三五年前,各種智能硬件的行業都起來了,但是很快這個行業又衰落了。

我甚至想要把機器人行業劃分成兩個分水嶺。在AI出現之前的機器人本質上都是自動化機器,沒有人的屬性。我們看產線上那麼多漂亮的機械手,其實都是通過非常原始的編程和自動化的設備進行生產的。即便今天在生產線上,也很難解決智能化的問題。

但AI出現以後,第一次讓機器有了人類的感知能力,我們以前的攝像頭看到的都是0101等一串數字,但今天攝像頭看到的是人臉;以前看到的語音是波形,我們現在看到的語音是文字。

機器開始有了人類的感知能力,使得AIoT的概念開始出現,看到這個機會以後,我們就去做了行業唯一的全鏈條AI技術。包括語音識別、視覺識別、導航、機械臂、麥克風陣列等,為什麼要做呢?

這是從內外兩個方面思考的。

第一個,獵豹移動在以前做的太快了。我們就做一個小工具,居然就上市了。後來等到Google發政策不讓我們做工具,手機廠商都開始自己做工具的時候,我們的日子就變得很艱難。所以我當時就想,擁有自己的底層技術很關鍵。

第二個,因為AI行業還處於早期。很多技術都不完善,或者沒有形成產業分工。但很多開發者,拿一塊板子,拿一個所謂的開放平臺,就想實現很好的語音識別效果,其實是非常難的。以智能音箱為例,換一個外殼罩上去,算法就得調整,因為混響不一樣。就像,在你的耳朵上加一個耳塞,聽力就可能大幅度下降,和你的大腦聰不聰明沒關係。所以整個人工智能產業的鏈條都非常新,又沒有足夠的分工。

第三個,我意識到,AI其實並不算是一個不可逾越的黑科技。很多人都說,BAT才能做AI,或者人家的積累更好一點。但是今天看來,開源代碼會遠遠豐富於任何一個時代。很多大洋彼岸的論文出現之後,中國的工程師就很快把它實現了。所以,好處就在於,AI大大降低了技術壁壘。而且AI使得以前很多公司的積累變得無效,大家處在同一起跑線上。我們認為,這是一個彎道超車的好機會。

所以,我們當時就下定決心,把所以技術全都幹了一遍,全力以赴打造全鏈條 AI 技術。全乾一遍的好處就是,我們能夠自主調整很多細節。

<strong>語音交互實現了命令的自然化 可能顛覆手機的中心地位

我認為真正有智能的第一個硬件品類,應該是智能音箱,我一直在想,語音識別是什麼東西?今天有人談“語義理解能力超過人”。只要看到這種標題,基本上都是騙子。

為什麼這麼說?在語義的理解上,AI離人有巨大的差距。因為語言是人類超級牛的發明,你能夠把你對世界的理解,壓縮成一串很短的文字輸入給對方,對方聽完以後,能把這個圖像、事件還原出來,這是個相當牛的能力,人類之間的交流是帶有巨大的信息壓縮和背景知識的。

所以,今天機器完全做不到。AI想在閱讀理解上超過人類,那是在一個很有限的短文章裡,沒有實際意義。

真正的語音操作是什麼?我認為它的本質是實現了命令的自然化。喬布斯有一句話說,每一次交互操作的演進都是一次革命。蘋果有幸抓住了兩次革命,第一個是抓住了鍵盤和鼠標,第二個是抓住了觸摸屏。

今天的手機不是因為它有多麼智能,而是因為它有強大的處理能力,你可以非常方便地touch。所以手機立刻取代了以前的PC、電視,成為了你的中心位置。

但語音使得手機的中心位置有可能被顛覆掉,你想象一下,語音是什麼?比如,你想看《延禧攻略》,以往你需要從口袋裡掏一個東西,解鎖、搜索,未來可以用語音就直接喚醒:我想看《延禧攻略》。

我甚至認為,雖然手機還是個非常關鍵性的設備,但下一代設備都可以變得去手機化。

兩年前,我們是業內第二款做智能音箱的廠商。我們(聯合喜馬拉雅)做了一款小雅音箱,當時很多人就問我,智能音箱有多智能呢?我回答:你不要考慮它有多智能,你只要考慮它是個搖控器,能夠非常簡單地點歌、瞭解天氣,設置鬧鐘。我們買來了對手的產品,我們發現點歌根本點不準,只有50%的準確率。為什麼?不是語音識別的問題,而是內容上的問題。比如說今天抖音出了個神曲叫《我們一起學貓叫》,你的曲庫裡得有這首歌。有的時候用戶說叫“學貓叫”,有的說喵喵喵,有多種的說法。這不是一個智能的活兒,這是個產品的活兒。

所以我們就把音樂的點播率和內容的點播率,這一件事兒做好了。當時,我覺得智能音箱的核心不是它有多智能,而是一種新的交互模式。這種新的交互模式本質上就是一個搖控器,它把極其複雜難用的搖控器給改掉了,這個進步是非常巨大的。

iPhone剛出來的時候,大家說這個沒有全鍵盤、沒有硬鍵盤怎麼用,輸入內容太慢了。但就是因為它方便,你可以容忍它非常多不夠快速的地方。

我們賦能了很多物聯網的中樞,我堅定的認為,語音是下一代操作系統的界面,它一定可以使得物聯網的很多設備變得智能。可以跟你直接交互,不需要通過手機APP的方式,它自己就被賦能了。我們跟很多廠商合作了很多款音箱,因為我們覺得打音箱上的戰役可能打不過,但是合作是有機會的。

<strong>人工智能不會顛覆人 只要一點突破就會帶來變革

我們還做了一款能移動的售賣機——零售機器人豹小販,它會主動問你是否需要商品,用戶掃描二維碼就可以購買。看到人多的地方它就會過去,因為它有人臉識別技術。以前,售賣機只能放在一個地方,如今,自動售賣機的售賣效率,大概是傳統的三到五倍,用互聯網的定律看,當多一個鏈接,互聯網就損失了50%以上的流量。而在線下零售端,當你從原有的位置走出來,讓用戶看到有一點點改進,效率的改變是巨大的。

在機械臂方面,我專門去發那科看過他們的生產線。我個人覺得,在精密製造上和日本、德國企業去比拼,是沒有機會的。因為他們是三十年的積累,可以用機械臂生產機械臂。但是他們面臨一個問題:整個產線投產週期非常長,他要改變一個產品的時候,整條產線都要變,成本非常高。

我一直在想,AI 出現之後,可能不需要精密的機械臂,來做生產。我想到我奶奶的手,哆哆嗦嗦的,但她仍然能夠織毛衣,還可以穿針引線。核心不是因為她的肌肉能夠多麼精確地控制,而是因為她能用眼睛做最後一點點調整。

受此啟發,我們在機械臂上加上了攝像頭,使得它去抓杯子的時候,杯子怎麼樣放都可以抓得到,這樣可以降低對機械臂精度的要求。

做機械臂的機床,如果從日本買,大概需要 2000 萬的投資,六個月之後拿貨,我們現在正在嘗試用韓國產的機床為我們做諧波減速器,未來可能用國產的機床。雖然精度降低了一點點,由於由於有視覺技術,所以它最後肯定能完成動作。

因為機械臂最大的成本就來自於諧波減速器,我們正在做的機械臂,未來可以降到市場價格的三分之一。當機械臂的價格降低,可能會產生新的、比工業市場大十倍的市場,市場增大十倍之後,成本又會進一步降低。在 AI 賦能之後,機械臂是有可能實現跨越式增長的。

在接待服務方面,如果大家有興趣的話,可以去獵豹移動參觀一下。我們的前臺已經是機器人接待了,我們是一家沒有前臺的公司,只有機器人。你來的時候,我在OA上提一個申請,然後你會收到一條數字碼,機器人就會過來。你跟它說“我來面試”或者開會,把數字碼輸上,它給你拍張照,在我們的閘機上刷一下臉,你就可以進入公司,它也會帶你去會議室。

今天講人工智能,很多人太強調所謂顛覆人的智能,這條路我還沒有看到顛覆人的地方。但核心是有可能實現一點點突破,比如說它能夠把原來的0101這種信號,對應成真正的人臉和語音的字節的時候,其實我覺得這個機會就已經非常非常巨大了。它會讓很多設備具備人的感知能力,在一個非常垂直的領域,完成一點點工作。這一點點工作,可能會帶來巨大的變革。

我們最近剛跟一個酒店簽約,我們的音箱進酒店了。以後你到房間以後,你就直接可以說,開燈。你可以跟音箱說:“給我來支牙刷”,酒店系統就會收到,服務員很快就會把牙刷送過來。這樣的話,通過人工智能技術可以讓物聯網的設備變得更聰明,而且真正可以使得照明、空調等設備變得互聯互通,非常好用。

我希望機器人也好,音箱也好,都能跟各行各業合作,我們的本質不是想做一個硬件,我們的本質還是想做一個AI賦能的雲端操作系統,跟開發者一起做更多的物聯網設備。謝謝大家!


分享到:


相關文章: