Jovi,第二個自己

Jovi,第二個自己

這是一個人工智能系統如何誕生的故事,已經實現的科技與算法背後,是更深遠的哲學問題。

關於一群人在時代浪潮中的選擇,他們如何探索自己,如何探索同類,又如何探索機器與人類的未來。

文|金鐘

操作系統

飛機即將落地,腳下是寬闊的俄亥俄河河口,森林與山地環抱之中,匹茲堡的輪廓出現了。這座城市,曾因鋼鐵繁榮了百年之久,又在上世紀70年代迅速衰落,與底特律、克利夫蘭、芝加哥並稱為美國的「工業鏽帶」。如今,它因為在人工智能領域的領先地位,有了新的聲名。

出了機場,5位來自中國的旅客直奔位於匹茲堡郊區的卡內基梅隆大學。這是一所在全美計算機科學排行榜上名列第一的大學,12位圖靈獎得主和20位諾貝爾獎得主在這裡度過了他們的大學時代。

6月的校園,草木茂盛,參觀計算機科學學院時,這5位中國旅客深受震撼。來自語言技術研究所的女教授Rita Singh向他們展示了自己研發的音頻分析算法,她可以通過一段電話錄音,推算說話者的性別、身高、體重甚至面容,推斷通話發生的地點是否有窗戶、牆體的材質,並根據當地電網的電壓波動,推算通話發生的物理位置及通話時間。這個算法Rita Singh研究了20年,如今已被美國的政府使用。

這是2017年夏天,中國手機廠商vivo核心技術團隊的美國之旅。Vivo CEO沈煒,帶著核心團隊在美國東、西海岸拜訪了兩週之久。

「雖然我們一直在做這方面的研究,但科研機構在AI技能、算法方面的成果,還是讓我們重新認識了這個行業。」一起赴美的vivo人工智能負責人周圍發現,很多前沿的研究,像聲音、機器視覺、語義理解,在這些優秀的科研機構裡面已經沉澱上十年的時間了。「人工智能時代到了。」

赴美前,中國棋手柯潔和人工智能機器人AlphaGo剛剛在烏鎮對戰。在這場比賽裡,排名世界第一的年輕棋手,曾在中途躲在宣傳板後失聲痛哭,直到20分鐘後裁判長找到他。這場頂尖級比賽的意義太複雜,它不僅關於圍棋,還關於全體人類對科技、對未來、對自我認知的拆毀與重塑。更是一種宣告——人工智能時代真的到來了。

對一直站在科技最前沿的手機行業,這個結論同樣成立。這也是為什麼在回國後,沈煒做了兩件事:一,讓技術人員再去美國拜訪;二,重新規劃擴建自己的人工智能團隊。沈煒認為,因為有了人工智能,手機完成新的代際更替,從原來的Smartphone,變成了真正具備智慧的產品。

vivo的管理層曾一起觀看過斯派克·瓊斯導演的電影《Her》。那是一個愛情故事,孤獨的男主角愛上了他的操作系統Samantha。在片中那樣一個危機四伏的後現代社會里,這個溫暖又悵惘的故事,給了觀眾痛和甜的體驗。

但不僅於此,它如此真切地描繪了一個激動人心的圖景,在未來,人工智能助手將陪你一起生活。它體貼溫柔、善於溝通,它瞭解你,感動你,撫慰你,與你建立超越肉身的親密關係。它是你最好的伴侶,同時也學習你,是你更完美的一個自我。

vivo的管理層不是唯一被Samantha打動的人。早在8年前,蘋果創始人喬布斯就已看到了浪潮。那一年,蘋果花2億美金買下Siri的創始公司。在Siri創始人之一Dag Kittlaus的客廳裡,他們聊了三個小時關於未來的超現實主義話題,喬布斯認為,Siri絕不是一個搜索工具,而是一個人工智能助手。而他們對這個助手的想象,就是Samantha。

那時所有人都堅信,「Siri最終會在宇宙中留下自己的痕跡。」

Jovi,第二個自己

Jovi

2018年3月19日,距離美國之旅已經過去了9個月時間。那幾位當時被AI趨勢打動的中國旅客,交出了自己的答卷。

在這一天烏鎮的發佈會上,vivo推出了新手機X21,手機裡已經有了一個名為Jovi的智能助手。這就是他們的Samantha。

單看新手機的外表,已經很炫目了。這兩年大熱的全面屏、屏幕指紋解鎖、面部識別,它都完成得很漂亮。用指紋解鎖的瞬間,你可以看到電路板上有閃亮的電流流過。新的廣告片裡,是時下最受關注的年輕明星鹿晗、周冬雨和彭于晏。發佈會上,穿著襯衣、年輕俊朗的產品經理侃侃而談。

但這些都沒有Jovi來得意義深遠,Jovi生活在X21中,這是它的第一個版本,可以在13個具體的場景之下給用戶幫助:你定了車票、機票,它會提醒你時間、目的地天氣和機場路況;你要上班,起床了它就會告訴你路況和路線,這是根據你長久以來的出行習慣;如果你喜歡看球賽,它會幫你跟蹤歐冠和NBA賽事;它能在你出行前,為你安排行程。

智能機時代,人們已經習慣了打開一個個孤島般的App,Jovi的工作就是打破這些孤島,整合這些數據,瞭解你、模擬你,它的終極目標是成為第二個你,甚至比你更瞭解你自己。

vivo品牌戰略總監黃善一,是Jovi整個品牌設計的負責人。在接到任務的第一刻,他就在想AI品牌如何和vivo形成一個有機整體。

「Joy?magic?vivo的人工智能應該是什麼樣的?」黃善一拿著這個問題,反覆地問自己、問團隊,也不斷地「拷問」人工智能團隊。這個過去一直在寶馬汽車從事品牌戰略的韓國歐巴,在2017年進行了一次人生職業規劃的轉身。從汽車到手機,產品形態發生了變化,但黃善一堅信用戶的需求不變。

「Join,enjoy」,Jovi一呼即出,這就是vivo人工智能想給消費者帶來的感受,「快來加入我們吧,join這個年輕時尚的圈子,enjoy貼心的提醒以及拍照和遊戲的夥伴,這就是我們vivo的人工智能——Jovi。」黃善一說。

最初,Jovi是不夠聰明的,它需要人去訓練,需要長久的陪伴。你使用的時間越長,操作的次數越多,它對你的畫像越精準,操作越合你心意。這後面的本質是算法,是vivo超過一萬臺服務器的日夜計算。還有語音的識別,語義的分析,機器的自主學習。

這也是國內首個手機內置的人工智能助手。它的操盤手周圍,是vivo公司13年的老員工,曾經的程序員、軟件工程師,如今vivo人工智能總負責人。他是個安靜的人,一張圓臉,戴一副眼鏡,說話很輕。

在創造Jovi的9個月裡,很難想象他經歷了什麼。

每一步都走得很難。人工智能的關鍵在於算法,偉大的頭腦寫就他們。周圍知道,許多優秀算法都是在大學的實驗室裡孕育的。他們按照一個個榜單,如機器視覺、語義理解,去拜訪國內前十名的大學。哈工大的語義實驗室,是全球範圍內的第一名,負責的劉挺教授到珠海開會,周圍就帶著人在酒店等著。

算法有了,實現它的功能,需要器件。芯片、麥克風、攝像頭、屏幕,都來處不同。他們一家一家去談,挑的都是最頂尖的產品。除此之外,還要兼顧消費者需求、組織、數據……

許多大公司喜歡建造一個封閉的體系,這是一個安全的選擇。但vivo的想法不同,在周圍看來,人工智能時代,不是企業做一個芯片、做一個算法或者做幾個產品,就能把這件事情做好,手機廠商的本質是平臺,「彙集這個行業裡面最優秀的器件,最優秀的算法,最優秀的垂類能力和服務給消費者。」

最艱難的抉擇還不在這裡,而在於打破他們原有的盈利模式——手機預裝軟件是手機廠商重要的收入之一,如果Jovi得到大規模使用,手機APP將會不再那麼重要,手機廠家現有的應用分發的盈利模式也將被改變,但服務與應用將會直達,用戶將會因此得到更好的生活體驗。

Jovi,第二個自己

時間到了

vivo的管理層有自己的考慮。

他們都是一群手機行業的老人了。周圍工作18年,做手機13年,而管理層的其他成員在行業裡甚至超過了20年。這個行業繁花似錦,競爭與迭代的速度遠超往日。他們知道,即使剝皮見骨,人工智能,也是不得不打的一仗。

我們聊起創業史,那是整場談話中周圍最興致勃勃的時刻。問他是否還記得當年vivo的辦公地址,他飛快背出「深圳科技園南區R2-B樓」,怎麼能忘記,那是一群年輕人付出的上千個日夜。

2005年,功能機的時代,周圍到vivo做的第一款手機,第一次有了mp4,那個年代,彩鈴和MP3是最流行的技術,MP4是完全領先的功能,那是行業裡了不得的進步。但你能感覺到世界在慢慢變化。2006年,CEO沈煒已經看到智能機的未來不遠,讓周圍拉著9個剛畢業的工程師,開始做實驗。

在那三四年,做出一個有操作系統的Linux手機,是這群工程師唯一的職業理想。Linux,是一套免費使用和自由傳播的操作系統,在由它發展而來的手機操作系統 Android出現之前,它是無數軟件工程師的方向。

坐享成熟的Android和IOS系統的這一代年輕人們無法想象,在當時,做一臺智能手機有多難——就像上帝創造世界,你要從無到有創造它,還要試圖讓它正常運轉。

他們花了2年時間,移植linux到嵌入式CPU上,自己編寫系統通信總線,編寫窗口管理器,編寫一整套的用戶界面,幾百個日夜,終於完成了樣機,但是CPU很慢,C++完成的系統效率也不高,樣機看起來體驗很不好。把寶貝一樣的成品拿過去給CTO施玉堅看,施戳了一下,隔了400毫秒,撥號界面出來了,他說了一句,「嗯,有點慢。」

「那句話,對我打擊很大,很大很大,我跟施總做了13年以上的同事,那是他說得最重的一句話,當時我眼淚都要下來了。我認為是行業裡面優化得最好的手機,400毫秒已經能出一個撥號界面,我覺得很厲害了。」周圍說來,語氣激動,仍為當年那個年輕的程序員感到委屈。

不過,改變很快就來了。2007年,谷歌推出了Android,這是一個開源系統,他們飛速迭代,很快把Linux系統甩在了身後。vivo用了Android,周圍說自己是一個「懂得感恩的程序員」,他成立了谷歌在深圳的開發者社區,還幫谷歌在中國推廣Android。在社區論壇裡,現在都可以看到他當年的ID:Wei Zhou。

同年6月,初代蘋果手機也來了。它被人們視為真正推開了智能手機時代的大門。全球手機市場的競爭,進入了新的階段。

2014年夏天,vivo剛入職的產品經理洪傑鴻被派到了鄭州的二七廣場,在正式工作之前,他需要去手機賣場呆一段時間,瞭解行業與用戶的狀態。那一年多,正是各大手機廠家酣戰與轉型的關鍵時刻。在這個典型的二線城市商場,他看到了變化的發生。

最初,廠商們在硬件上比拼,比如屏幕大、續航好、像素高,這會成為用戶購買手機的關鍵。漸漸的,這些要求每一家廠商都有能力去滿足了,體驗和軟件成了線下廝殺的關鍵。用戶關心什麼功能,他們就去更多地實現它,比如拍照,可以逆光,可以美顏,還可以雙攝。但很快,這些功能也做到了極致。縱觀整個智能手機領域,大家的差距已經越來越小。

那下一步的競爭在哪裡?在2017年5月的谷歌開發者大會上,谷歌直接把公司未來戰略定在了人工智能上,「機器學習」是他們提到最多的詞語。

事實上,在此時,vivo公司的整個供應鏈條、所有的廠商,甚至是整個中國,所有的資本與熱錢,都已同樣進入人工智能的浪潮之中。

時間到了。這家在業內以低調、謹慎甚至保守出名的公司,在長時間的觀望之後,也做出了入局的決定——看明白了,用人工智能技術去整合硬件、軟件與服務,可能是未來十年他們能抓住的最大機會。

他們要做的不是一個功能,而是一個系統,「哪怕費力一點也要做,因為你繞不開。語音交互是最自然的一個交互方式。為什麼要取一個名字叫Jovi?你必須把它形象化。用戶是需要重新認識和適應的,要讓更多的用戶慢慢去用它,習慣去用這個東西。」

Jovi,第二個自己

機器之心

讓更多人接納人工智能,並不容易。從1950年曼徹斯特大學校園裡的艾倫·圖靈提出「機器能思考嗎」這個問題至今,人類從未停止懷疑,人與機器之間,具有靈性的血肉之軀與程序鍛造的鋼鐵之間,能互相理解嗎?

沒人能給出一個確定的結論。但已知的是,vivo在預測你是否會拋棄正在使用的手機時,準確率已經達到了86%。究竟是什麼原因,或者是什麼原因的疊加,會使你拋棄它?我們不知道,但機器知道——「人操心的事情只有幾個維度,但可能500個維度都會影響,你操心不過來,但你可以讓一個小型機把這500個參數全部運算一遍,通過機器學習,它就會給你答案。」

如果要從技術層面來解釋人工智能,其實並不難。卡內基梅隆大學計算機科學系的教授邢波在去年的一次演講中描述了人工智能研發的過程——首先是取得數據,第二是明確你要做的功能,比如做圖像識別、下棋或者機器人。再往下就是算法,它用來解決這個題目。再就是計算設備,去實現軟件。再往下是一套程序,對接硬件和軟件。

對中國的手機廠商來說,取得數據容易,但問題的關鍵在於他們怎麼去知道人們對人工智能的需求。更深遠一些,這個問題指向的是,人如何理解人,又如何使用機器理解人。正如臺灣金馬獎獲獎電影《大佛普拉斯》裡的旁白:現在已經是太空時代了,人們可以登上月球,卻永遠無法探索人們內心的宇宙。

產品經理洪傑鴻,負責的就是研究消費者,洞察他們的需求。他每個月有三分之一的時間都是在與消費者當面溝通,接觸到的是這個時代人們熱騰騰的生活。時間久了,他總結出來一些東西,比如:「很多城市的這種消費者喜歡健身時拍照,是因為健康嗎?不是。是因為想發朋友圈。」

他還發現,國家的政策也會對消費者需求產生影響,比如二胎政策放開之後,給孩子拍好照片成了他們的需求。孩子不好拍,他們會動,會變,用戶想記錄孩子的狀態,想分享給別人,還不能暴露太多信息。

這些需求因人而異,很難總結,很難量化,一次調研往往要花三個月以上的時間。在研發Jovi時,周圍因為上線時間而焦慮,忍不住和洪傑鴻發了幾次火,問他:「你到底什麼時候才能把需求給我?」但洪傑鴻仍覺得不夠了解消費者,直到反覆驗證過後,才把需求轉給技術團隊——在現階段,拍照和遊戲是用戶比較看中的功能。

需求之後,就是算法。這是這個行業的核心,也是競爭最激烈、最殘酷的領域。如果沒有大量的數據去訓練,算法也無法發揮效果。正因為擁有巨大的數據入口,vivo接觸了中國人工智能產業大量的獨角獸公司、最傑出的年輕人。

洪傑鴻也發現了這群人的改變。最初他們更理想主義,或者說更geek,一個商務帶一個技術去找他談,談的都是參數、測試。現在往往會加一個產品經理,開始談需求,談這個算法如何真正落到現實生活中。

遠大前程

算法、器件與數據的組合,能夠迸發出多大的力量,樂觀者有之,唱衰者亦有之。

關於此事最著名的爭論出現在硅谷大佬扎克伯格和伊隆·馬斯克之間。馬斯克很早就對人類使用人工智能的方式擔憂,扎克伯格在去年的一次直播中隔空回應,對AI鼓吹末日論的人是不負責任。馬斯克當仁不讓,在Twitter上回擊,「我和扎克伯格討論了此事,他對這事懂得太少。」

就在採訪周圍的前一天,在美國亞利桑那州,49歲的伊蓮·赫茲伯格在過馬路時,被一輛Uber無人駕駛的汽車撞倒並最終死亡。警方要求Uber停止了無人駕駛汽車項目。

所以,人工智能的前程,也成為我們這場訪談躲不開的話題。

但事實上,Jovi的「父母們」都是務實主義者。在他們看來,現在手機應用的人工智能,包括Jovi,都才剛剛起步,離真正的「通用人工智能」還距離很遠。

這也是為什麼,在3月的發佈會上,Jovi只是被短暫提及——因為它還沒有足夠成熟,還需要時間去訓練。半年後、一年後,它將會是嶄新的面貌。

但身處這個行業的人們,已經看到了更遠的未來。

比如前段時間,周圍的一位家人因病暈倒。這讓他開始思考新的問題:如今我們的攝像頭,可以是紅外,也可以做超聲波,只要設計一個算法,它便可以在你看屏幕時感知和分析你的心跳、心率。「都看到你的心率、心跳不正常了,其實完全可以建議你提前就醫,對不對?」麥克風也是一個道理,如果你願意,它可以聽到你咳嗽的聲音、打呼嚕的聲音,也可以給你很多建議。

這不是空談。這些設想全都基於現在已經可以量產的攝像頭和麥克風,和已經可以實現的算法。

回到位於中國東莞的vivo廠區,他們要做的事情,是4個字,確保交付。如果確定要做監測心跳的功能,那麼第一步,去定製攝像頭,第二步,掃描全球的算法,安排好時間表,直到它按時上市。一個一個功能,去把Jovi血肉豐滿,直到接近你的自我。

「對機器來說,對智能來說,它是很簡單的一個邏輯。」但製造人工智能的人們始終明白,內心裡的切磋琢磨,關心和愛,不可量化,不可模擬,機器永遠無法替代。


分享到:


相關文章: