和我一起成長進化
Think big Think different
8月17日,我參加了2018 世界機器人大會,並在會上發表了主題演講。當前中國人口紅利消退,服務行業面臨一些瓶頸,比如企業很難保證萬人一致的高水準服務和低成本運營。
為了破解這一難題,獵豹移動聯合獵戶星空,自主研發了機器人全鏈條的核心技術,打造真有用的服務機器人,助力中國服務產業升級,希望讓“每個小賣部都能提供五星酒店的服務,每個鄉村都能品嚐到金牌大師的咖啡。”
以下演講全文,分享給你們:)
兩年前,獵豹移動在全球移動端擁有6億月度活躍用戶時,我就在思考一個問題:什麼是下一個時代更大的機會?
任何一家企業都是時代孕育和生長出來的。所謂的「創新」,無非是在社會快速變化的時候,抓住社會領域之間產生的縫隙和機會,然後再把需求發掘出來而已。
我個人並不認為我們有機會去做所謂的創新,我們更多的是做發現,去發現這個社會需求的變化,在恰當的時候,做一些恰當的事情,然後讓它自然地生長。
當年,在國內競爭太激烈的情況下,我們選擇了國際化,開發了獵豹清理大師,專門來清理手機上的垃圾和病毒。到今天為止,獵豹清理大師已經有幾億的用戶。獵豹移動在美國有幾千萬的用戶,所以很早就在硅谷設立了辦公室,我自己也在硅谷生活過一段時間。
大概4年前,我發現中國移動互聯網的應用,已經領先於美國了,在那裡上網購物不可能像北京一樣,幾個小時就能送達。此外,產品應用的研發和產品服務等方面,中國也是全面領先美國的。很多外國人到了中國之後不想離開,因為在中國,拿出一個手機就能滿街跑,但在很多地方完全做不到,甚至像日本的很多地方還只收現金,每次去,我都很頭疼。
01
人工智能帶來的新機遇
服務機器人助力中國服務產業升級
中國之所以有今天這樣的服務產業發展水平,實際上是依賴了互聯網技術的極大發展。
我記得有一次我跟Snapchat的CEO和軟銀的前CEO在東京吃飯。軟銀前CEO年紀比較大,他就說在東京,開車30分鐘內可以到任何一個口味的餐館,生活非常舒服。Snapchat的CEO才20多歲,像一個高中生一樣,但他說的一句話讓我印象非常深刻,他說這也許就是日本互聯網落後的原因。
有的時候,一個領域過於發達以後,其實也限制了下一個領域的崛起。中國正是由於在工業化進行到一半的時候有了互聯網,而互聯網又使得服務業實現了大幅度的升級。
但,我認為這波升級也到了一個轉折點,服務產業也會進入一個瓶頸期。
為什麼這麼說呢?我有個好朋友叫沈鵬(前美團外賣負責人&創始人、水滴互助、水滴籌創始人&CEO),他離開美團後創辦了一家叫水滴籌的互聯網保險公司。我說你為什麼會去做互聯網保險呢?他說,以前在美團指揮上萬個外賣小哥的時候,每天都會有外賣小哥遇到各種各樣的意外,他們就在群裡籌款。後來沈鵬就想,如果創業的話,一定要做一家能夠幫助服務人員提高生活待遇和基本生活保障的公司。所以,他就萌生了做互聯網保險的想法。
其實今天服務產業增長的瓶頸在哪裡?我相信大家一定能看到。
從社會背景上來看,我們的人口紅利在消退。而企業面臨的難題是什麼呢?主要有三點:
第一,保持萬人一致的高水準太難。如果是一家小店,其實很容易通過所謂的匠人精神,就可以把小店服務做的很好。但變成10家店、100家店、1000家店呢?沒有誰能保證服務能夠一致地實現高水平。這其中需要大量的培訓和完善的制度。
第二,保持長時間反覆高水準太難。我們的展臺上有一個機器人咖啡師,它能夠模擬WBC金牌咖啡大師的手藝去給你做咖啡。但是在咖啡界,如果一個咖啡師每天做超過30杯的咖啡,他就會疲勞,咖啡的質量就開始變的不穩定,而我們的機器人”豹咖啡”能做到24小時不疲勞,它可以持續保證這樣的高水準咖啡製作。
第三,保持越來越好的服務、越來越低的成本太難。每個人都是“由儉入奢易,由奢入儉難”,當我們享受高水準的服務之後,對服務也是越來越挑剔,但是用人成本越來越高,所以這就是一個企業的難題。
大概3年前的時候,以色列的一個小團隊利用AI技術做了一些功能,我覺得非常詫異。因為,我離開360的時候,做過一款圖片軟件。後來發現美圖也做了圖片軟件。有一天它推出了一個功能叫大眼睛功能。我們作為程序員和產品經理就很懵。我說我們都是把照片做的越來越真實,它怎麼做的越來越不真實呢?
因為當時沒有這樣的AI技術,它要求用戶用鼠標在自己的照片上點一下來放大眼睛。我說這個太low了,為什麼不能找到用戶的眼睛,系統自己放大?
然後我們就研究了很多的人臉識別的技術,例如Intel的開源計算機視覺庫:Open CV。我記得那個基礎庫只有60-70%的概率能找到眼睛,無論如何努力也提高不上去,我們只好放棄了。
就在兩三年前我就發現很多小團隊做的產品,能夠把人臉識別做的很好。後來我慢慢才知道,這背後有個東西叫AI技術。
機器人界有一個詞叫perception(感知),實際上AI是讓機器第一次有了接近於人的感知能力,無論是語音識別還是視覺識別。它可以在某一個領域上、某一個應用場景上接近於人,甚至在某些點上超越人,這是一個非常大的歷史契機。因為,如果沒有AI,攝像頭記錄的所有照片,在計算機裡都是簡單的0和1的字符串。只有當AI出現的時候,它才可以像人一樣知道:這是一張人臉、這是一句話。
正是這樣的技術發展,使得服務機器人產業有了新的機遇。
那麼,機器人產業到底是一個什麼樣的形態?其實在AI之前,我們所有講的機器人絕大部分都是一個機械化的工具,它很難有自主的感知能力,更多地是執行很多程序,很難跟環境發生真實的、自主的交互。
所以,在AI出現之前,我們談的機器人多數是工業化的機器人,更多的是自動化的機器,去重複一個被高度定製的機器行為。只有當AI出現之後,我們才有可能使得自動化的機器第一次從工業生產線走出來,奔向我們的消費生活場景。
生活場景是一個比工業生產線大十倍甚至百倍的場景。在這樣的場景中,機器人能夠在一個半開放的狀態下跟人實現互動,利用主動感知的能力為你提供服務。所以,這是一輪非常非常關鍵的歷史契機。
02
機器人是跨界行業
AI+軟件+應用+服務=機器人
我們沒有機會在工業製造領域去和領先的企業去競爭,但反過來看,有哪些好處呢?我認為,AI的出現,使得機器人變成了一個非常跨界的技術。只有機械製造、有空氣動力學是不夠的,只有AI的技術也是不夠的,還需要有互聯網的應用。
我把今天的服務機器人看成手機裡的一個個APP,我並不認為今天會出現一個能到處跟著你去完成所有任務的機器人。
每一個APP就是一個垂直場景,用這個維度去思考,你就會發現,以互聯網的思路重新考慮機器人,可以給它找到很多垂直的場景應用。我們就有機會把用戶體驗、機械製造、人工智能結合起來,做成一個又一個垂直場景的機器人。
所以,這也是我自己的一個機器人公式,就是AI+軟件+應用+服務才會等於機器人。今天在某一個維度特別突出的,未必能做出一款真正滿足用戶需求的機器人。我們今天在講技術創新、黑科技,其實所謂的技術創新或黑科技的本質——都是給用戶提供服務。
我自己並不算一個真正科班出生的技術人員。當我2002年進入互聯網的時候,我就莫名其妙的得到了一個職位叫產品經理,今天想起來,那個職位在當時來說,應該是互聯網第一批產品經理,我們並不懂產品經理應該幹什麼。但是我當時就在想用戶到底需要什麼?我怎麼把這個技術做成用戶需要的樣式?
因為當時遇到了一個最大的問題,就是做軟件的同事能夠寫出很好的程序,但是用戶不會用,後來我們才發現,原來用戶需要才是最關鍵的。後來我自己做安全軟件,在只有幾個人的情況下,對抗幾百人的傳統殺毒公司,我們用了看似非常low的技術,但是我們快速地滿足了用戶需求,使得我們的安全軟件在短短的兩年內在中國有超過50%的覆蓋率。
做海外市場以後,我們又做了獵豹清理大師這個工具APP,在美國提供下載,它看上去雖然是一個非常簡易的應用,只是幫你把手機裡的垃圾文件清理掉,讓你空間變的更大,但事實上在全球廣受好評。
所以,今天機器人一定要為用戶提供真正需要的服務,把所謂的黑科技,變成一個非常簡單使用的服務,而不只是一個技術參數。
由此,我們成立了一家叫獵戶星空的公司,它專門負責打造AI和機器人全鏈條的核心技術,然後再由獵豹移動過去接近10年曆史積累的用戶體驗,把他們結合起來,去打造真正有用的機器人。
03
自主研發AI全鏈條技術
致力打造真有用機器人
這裡著重介紹一下獵戶星空這家公司,為什麼要介紹它呢?
獵豹移動當年在全球做出幾億月度活躍用戶的時候,安卓手機已經是一個非常成熟的生態系統,只需要在上面做一個應用,就有可能讓全世界的用戶都去使用。但機器人行業還不是一個成熟的生態。我剛才講的AI+硬件+軟件+用戶體驗,這裡面每一個環節都很早期。
所以,這個時候,我很難在市面上找到一個符合需求的技術方案。當時我們就下定決心,根據自己的需要去定製所有的技術環節,使得組合起來能夠變成一個在用戶層面非常好用的產品。因此,我們花了很大的力氣去打造了語音識別、視覺識別、自主導航、機械臂技術。
當然,這也是這個時代給我們的最大機遇。很多人問:你一個做移動應用APP的,怎麼能夠做深度學習?深度學習好像只有大公司才能做。我說恰恰相反,深度學習給我提供了一個彎道超車的機會。
以前,感知學分為很多不同的專業、差別是非常大的,人臉識別、翻譯、語音識別,每一個領域都有專門的領域專家。但AI出現以後,使得這些看上去跨行業的領域變成了一個集中的底層,神經網絡模型能夠在語義識別、語音識別、人臉識別、圖像識別(等不同領域)達到同樣的效果。
所以,這就使得我們有機會用一個通用型的技術模型去解決在各個領域的感知問題。我們也是看到了這樣的機會,就定義了機器人的“眼耳口鼻手腦”,然後在每一個環節打磨技術。在打磨的過程中,我們又想避免自己成為研發型公司,所以,我們在每個領域都推出了相應的產品,讓用戶去檢驗我們的技術是不是真的好用。
比如我們的人臉識別算法拿過好幾個冠軍,但這隻能表明你模型的能力,這是不夠的。我們在很多地方都場景落地,這正是互聯網公司的優勢。我們在全球有幾億的月度活躍用戶,我們在美國有最大的第三方直播平臺LiveMe,我們每天有幾十萬的用戶在線直播,這直播裡面其實都是人臉的數據,這使得我們的人臉識別效果能夠很快的提升。
今天在獵豹自己的辦公區,幾千名員工,每天上下班、購物、會議室預定、公司會議都是刷臉識別。
我們還做了語音合成技術,就是TTS,昨天小米的小愛同學宣佈月活超過3000萬,小愛同學所有的聲音都是我們獵戶星空提供的,我們在這款聲音上也是花了很大的力氣。
其實語音合成不是一個特別高技術難度的產品。語音合成更需要你去尊重用戶體驗,但由於大多數公司很難去發表這方面的論文,所以他們基本上只是在用一個算法去實現。而我們用了大量的拼接技術、去一句一句的聽,然後反覆的調試,最後我們用語音合成了TTS,即小雅的聲音,非常溫暖、會跟大家打招呼。我們由此相當於開發了一整套以語音為基礎的語音OS。
大家可能不知道,今天美的音箱、喜馬拉雅的小雅音箱以及我們自己的小豹AI音箱,包括小米音箱的大部分語音識別,都是用了我們獵戶星空的語音識別能力,已經有超過千萬的用戶每天都在使用,而且我們接入了很多內容。
所謂的語音識別,它核心並不是一個所謂多麼了不起的黑科技,它的核心是一種新的交互界面。喬布斯說過,每一次交互界面的變革,都是一次產業革命的機會。
所以,從鍵盤到鼠標到觸摸屏、再到語音交互,其實它是一代又一代的交互革命。所以我極度看好類似於像智能音箱、包括諮詢服務機器人。因為它再也不需要用戶在一個沒有見過的屏幕上去觸摸,用戶只要用最自然的方式去表達,核心不是為了跟這個機器聊天,而是通過語音去獲取想要的內容和服務。
我們還做了室內導航的技術。如果一個機器人不能夠主動的移動就很難真正談的上是一個機器人,它和一個Pad就沒有什麼本質區別,所以我們在這方面也下了很大的工夫。
最重要的核心,不是它能移動,而是用很低廉的成本去移動,所以我們用了激光加視覺進行導航。我們的激光傳感器成本大概只有幾百元人民幣,用了大量的算法優化,使得激光和視覺能夠配合,在室內的空間裡能夠自主的移動和避障。
所以,這是一個多模態的導航技術,僅有一個點是很難的,就包括今天視覺,解決不了所謂的大逆光問題,玻璃反光的問題,我們都解決了,其實就是用多模態,用多種類傳感器進行相互融合的方式。
我們還專門加強了機器人的麥克風陣列,因為我們認為一定要達到,嘈雜的環境中還能精準聽到用戶的反饋。我們在這方面已經完全做到了高噪音下能夠基本可用。雖然還不能說100%保證每句話都能聽得懂,但對用戶來說已經基本可用了,還有語義定義這些就不一一贅述了。
我們在321水立方發佈會時發佈了5款機器人,有的人說你為什麼發佈這麼多款,為什麼不像手機廠商一樣只做一款?我說,就是因為這個行業處在很早期,我們很難像一個智能手機一樣,通過一次大屏的革命,就能在不同的應用裡都能滿足需求。
所以,我覺得這時候需要一個化整為零的策略,在不同的垂直場景裡提供不同的服務,讓產品和用戶一起去成長。當用戶反饋越來越多的時候,你慢慢就能抓住真正用戶的需求,從需求裡能夠抽象出相同的東西,讓它變成統一的產品。
但在今天,我認為當前的機器人行業還很難推出一款類似於iPhone那樣的產品,能夠以這樣一個產品的形式,就幾乎滿足用戶對移動電話和智能電話的所有需求。所以這是我們要做好幾款產品的核心原因。
這裡面有我們主打的一款產品,叫『豹小秘』接待服務機器人。必須得承認,我當時特別希望它有一雙手,能夠端茶送水。後來經過我對整個技術細節不斷考量之後,我認為今天有一雙手可以給你端茶送水,還能自主移動的機器人過於複雜、成本過高。
今天帶一雙手的機器人原型產品還在公司裡,但後來我們決定砍掉這雙手,讓它更聚焦。
它真正核心的應用就是幫你提供服務,它能夠像一個前臺一樣給你預定會議室,經過人臉的識別就可以介紹公司的歷史,它可以像一個講解員一樣,在博物館帶著你走到每一個名畫前面,去回答你關於這副畫的提問,給你介紹這副畫的背景。
它可以像一個促銷員一樣,當你走過店面的時候,告訴你今天又有打折的信息。今天我們出了新的菜品,有沒有興趣品嚐一下?如果你不願意進店,它可以在這裡告訴你,給你展示圖片。
其實這樣的需求,我認為是非常多的,我們把它定義成信息的諮詢服務。今天有大量的工作崗位都在提供這樣的服務,事實上這樣的崗位很難保證服務水準的一致化。但是,機器人能做到。
我們每個人在講機器人、人工智能、語音識別的時候,我們經常會看重它會出錯的場景,因為各種感應器、攝像頭、麥克風還不能夠達到人眼和人耳水平。
今天人工智能並不能像人這麼動態的理解各種定義場景,在很多時候的確容易出錯。但是,人工智能最大的好處在於它能保證一個標準以上就不會再掉下來,它可以保證不斷的重複。
我們為了達到這一點,用了大量的傳感器和芯片的組合,保證「豹小秘」在我們定義好的場景裡實現高標準的交互和服務。現在獵豹移動已經開始用這臺機器人取代前臺。每個用戶來的時候,我們都能保證「豹小秘」在接待水準上的一致化。而且「豹小秘」已經在鳥巢的一個博物館開始上崗,只要用戶願意掃一個二維碼,它就可以帶著用戶去講解每一副名畫。
除了信息諮詢服務之外,我們還在思考,有沒有機會讓機械臂從產線走到生活場景。因為我認為這是一個巨大的能夠提供重複勞動的場景,以前走不出來的核心原因是什麼?是因為它太貴了,我們都知道一隻機械臂動則十幾萬、大幾萬的價格,它很難進入生活場景。
但我們反過來想,為什麼它很貴?因為在AI出現之前,所有的機械臂的動作都要高度定製。那時候我們對機械臂最高的要求是它的精度,因為它一旦到不了那個位置,就擰不了那個螺絲,擰不了那個螺絲就會導致整條生產線停下來。
但今天由於有了AI,即便我們的誤差稍微大一點點,我們可以在最後的時候讓它重新做校正,這就是我們在做的一件事,我們在機械臂上加了一個攝像頭,使得它能在最後的時候能校正自己的行為。
將AI和機械臂結合起來,我們就可能用廉價的方案製造更多的機械臂,使得成本降下來。由於機械臂有了視覺能力,使得部署環境不需要那麼苛刻。
我們今天做了一款機械臂,比如,在做咖啡的場景中,機械臂按取杯器的時候,它知道杯子是否有掉下來,如果發現沒有掉下來,它會再按一下、加大一點點力度,這就解決了以前在工業生產線上特別複雜的部署問題。所以我們非常有信心把這款機械臂的價格親民化,使得它大量地完成重複勞動的工作。
我們為它做了一款(機械臂咖啡亭)「豹咖啡」,最近我們剛跟luckin coffee品牌合作,請了WBC的金牌咖啡大師去示範搖咖啡的動作。我們現在已經做到不需要編程,一個人做一個動作,機械臂就會完全根據這個軌跡來模仿動作。
我們做了一整套關於學習運動軌跡和用很多子動作拖拽來完成一個複雜的機械臂運動的軟件。這樣有軟件和AI,使得我們整個機械臂的運轉變得更加容易。
所以,這也算是我們的口號,我們希望讓每個小賣部都能提供五星酒店的服務,這在以前是非常難的,五星酒店之所以是五星酒店,就是因為它的服務高標準和一致化。
我認為一旦我們的產品能夠在一個非常簡單的垂直場景,實現用戶滿意度的話,它就可以大量複製。
我們也希望讓每個鄉村能夠品嚐到金牌大師的咖啡。在一些地方,連鎖咖啡機構的最大難題就是招不到好的咖啡師,因為需要培訓,還要面臨高昂的人力成本,而我們的機器人只會越來越便宜,越來越普及化,讓大家追求夢想的同時享受越來越好的服務。
最後說一句,希望我們能夠做出真有用的機器人。我們不希望機器人只是一個噱頭,或者是一個所謂的黑科技。它就是應該切切實實走在我們身邊,幫我們提供服務。從一個小點開始,它就會慢慢變成和我們人類共同生長、生活的好夥伴。
我們也希望獵豹移動有機會可以和大家一起,助力中國服務產業升級!
有任何創業、職業、個人成長等問題,歡迎添加微信(ID:fsgogo),加入盛盛GO精英成長社群。
閱讀更多 傅盛 的文章