03.08 碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈推出首檔訪談欄目《AI百人》,專注人工智能垂直領域,邀請頂級AI行業領軍者,呈現獨家觀點。

本期嘉賓:

碼隆科技聯合創始人兼CEO黃鼎隆

黃鼎隆

碼隆科技聯合創始人兼CEO,清華大學人機交互博士畢業,師從美國工程院院士Gavriel Salvendy,發表人機交互領域國際頂級學術會議及期刊論文 7 篇。曾就職於谷歌、微軟、騰訊和TripAdvisor,歷任用戶體驗研究員、產品經理、產品總監、產品副總裁等崗位。

碼隆科技

碼隆科技是一家專注於深度學習與計算機視覺技術創新的人工智能公司,通過工程架構能力及產品實現能力,為企業客戶提供國際領先的計算機視覺解決方案。公司開發的ProductAI人工智能商品識別平臺,為企業提供全球首創的商品識別服務、自助定製化以圖搜圖搜索引擎,以及通用圖像識別技術支持,助力傳統行業企業充分利用人工智能技術實現更高效率、更高質量的現代化運營。

2014、2015年是計算機視覺智能技術公司興起的節點,在黃鼎隆看來,這是因為如今這波人工智能浪潮中,深度學習是最核心的技術。

不同於大量源自視覺領域的安防項目,碼隆科技推出主攻商品識別的智能產品“Product AI”。黃鼎隆認為,該技術應用較於安防要更復雜。

創業三年多,他覺得行業處在一個“並不需要太擔心資源”的環境中,“包括資金、人才、媒體關注、政府支持等都湧入這個領域”。

對於視覺智能行業來說,目前還存在大量入局機會,因為“技術已經到達一個臨界點,可以考慮去實際應用了”。該過程中,就需要與各個垂直行業的知識經驗、生態相關問題結合。此外,傳統行業轉型,積極引進AI新技術,亦存在大量創業機會。

對於10年後的技術發展預測,黃鼎隆認為手機當下“艱難”的交互方式可能會變革。

未來圖靈與黃鼎隆展開了一場深度對話,共同探討了碼隆科技打造的視覺智能產品的研發理念及場景應用,以及當下人工智能領域的技術壁壘、發展前景等熱點話題。

以下為對話內容,由未來圖靈編輯整理後發佈:

未來圖靈:我們之前做了一個統計,差不多在過去五年間,國內一共誕生了一千多家人工智能公司,2014至2015年間尤其多,特別是計算機視覺領域。為什麼該時間點會出現這個現象?

黃鼎隆:其實可以參考Google Chart上兩個關鍵詞的搜索量,一個是過去的技術pattern recognition,即模式識別;一個是深度學習。這兩個關鍵詞都是計算機視覺領域很重要的技術。這波新的人工智能浪潮中,最核心的技術就是深度學習,從搜索關鍵詞的趨勢可以看到,以前是模式識別的天下,但深度學習在四五年前開始興起,被研究人員關注到。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:碼隆科技就是在2014年7月份成立的。

黃鼎隆:對,這個時候是深度學習剛剛起勢的時候。一些人工智能企業都誕生於這個時間點,首先如果公司成立時間太長,這時可能會有比較強的技術包袱,因為之前整個人才和技術結構可能是基於模式識別搭建的。而太晚建立的話,因為勢頭已經起來了,在前面起來的人已經把錢拿到了。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:很多公司是從安防領域切入,而碼隆科技不同,是有意而為之還是基因決定的?

黃鼎隆:碼隆是專門做商品識別的,這一點從創立之初到現在都沒有變過。這與團隊的基因、看問題的方式和出發點是相關的。其他的人工智能公司做安防領域,也非常容易解釋,因為有了技術後,發現它可以用來解決人臉識別的問題。再者,三四年前安防行業又能夠賺到錢,又有市場。但是碼隆是一個產品基因比較強的團隊,我和Matt兩位公司聯合創始人之前在微軟時就是一對產品開發搭檔。

黃鼎隆和搭檔Matt

未來圖靈:產品導向的具體表現是什麼樣的?

黃鼎隆:做產品的人出發點就會不同,首先他會去定義問題,以及尋找問題在哪裡。碼隆科技也是從一開始就瞄準了商品識別這一市場,而彼時深度學習恰好就是解決計算機視覺問題的一個好機會,我們也在思考能不能打造一個visual decision engine,即視覺決策引擎。三年多以來,我們圍繞它開發了各種各樣的技術應用。

未來圖靈:在計算機視覺方面,人臉識別是有容錯率的,但如果這項技術應用在商業角度的輔助決策,需要容錯率極低。那是不是意味著這需要更高的技術要求,即我們做的東西要比人臉識別更難,門檻更高?

黃鼎隆:在我看來,商品識別確實比人臉識別難,但不在於容錯率。

商業世界本身就是一個不完美的世界。如果你對比其他的涉及生命安全的領域,譬如醫療、無人駕駛等,容錯率是非常低的,但在商業世界中,我們要做的事情幾乎此前都有人在做的,只是我們的目標是讓AI做的比人更精準、更快、成本更低。

對比兩者的難度,人臉識別的本質上是你給它一個臉,它從一個數據庫中找到對應的一個人,建立起映射關係;但對於商品來說,單單找到映射關係還不夠。比方說,它如果拍一下你身上的衣服,不一定要找到一模一樣的衣服,也許是衣服的風格吸引你,也許是它的領型、袖型、某種材質或上面的圖案影響你的購買決策。所以商品識別技術還要求它把商品的各種屬性識別出來,這就是一個更加複雜的問題。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:那它相應的更新速度也要快很多。

黃鼎隆:當然。

未來圖靈:每天都有新的產品和產品形態誕生,碼隆科技如何進行數據更新?

黃鼎隆:這波人工智能的核心是在於計算機有了學習能力,可以去捕捉最新的一些信息,並且去快速迭代學習,所以你說的這一點,恰恰是這一波技術的優勢所在。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈: 2016、2017年人工智能開始變成全民話題,而非技術性話題。這股熱潮對像碼隆科技這種面向B端的公司,在業務開展上有無一些幫助,或者其他影響?

黃鼎隆:有幫助,整體是獲得了更多的資源。

過去三年多創業依賴,感覺被很多力量往前推著走,包括資金、人才、媒體關注、政府支持等都湧入這個領域,使得

我們處在一個並不需要太擔心資源的環境下。因為科技創新其實是一件很耗費資源的事情,但在人工智能創業的黃金時代,我們至少不用擔心。對於我們在做的商品識別,是要和各種傳統行業深度結合的,所以隨著這股浪潮,傳統行業人也有比較強的意願和我們一起去探索。

未來圖靈:2018年還是一個創業者入局計算機視覺領域的好年頭嗎?

黃鼎隆:首先我認為計算機視覺是一個大範疇,在不同的時機適合做不同的事情,現階段我看到一個機會,就是技術方面的進步現在已經到了一個臨界點。換言之,現在技術已經可以應用於各行業了,但應用本身不單單是一個技術問題,它還需要跟各個垂直行業深度結合,涉及知識經驗、生態相關。我認為這其中有很多機會。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:您賦予Product AI了什麼使命和願景呢?

黃鼎隆:其實Product AI顧名思義,就是AI for product,提供一個用AI專門為商品識別服務的平臺。它可以像每個商品所在領域的專家一樣去研究,比如像時尚設計師一樣看懂一件衣服,像家居專家一樣看懂一個沙發,零售專家一樣看懂零售場景裡面各種各樣的商品,而我們再把這樣的能力和商品背後的行業相結合,幫助各個行業以更高的效率和更低的成本給社會提供優質的商品。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:通過技術去實現這種時尚分析的技術形態是什麼樣的呢?

黃鼎隆:其實本質上是和AlphaGo下圍棋相通的,因為要像一個時尚專家一樣去看懂一個商品,首先要獲取到大量的數據,比如和衣服相關的各種圖片,以及圖片背後的這些標籤,就好像訓練AlphaGo所用的棋譜一樣。有了這些數據之後,我們需要設計一個適合去完成這個任務的深度學習的模型。

此外還有一個很重要的問題,商品識別的數據往往是有噪音的數據,在一個商業的世界裡面,你很難獲得很純粹的乾淨的數據。因為要用於商業應用,又是在一定資金和時間的限制下的,前後是矛盾的。所以我們也基於此開發出了一個叫作“弱監督式學習”的深度學習算法,可以利用沒有經過人工標註的一些含有噪音的數據,這在商品識別領域也非常重要,並且我們也憑藉這個技術獲得了今年WebVision全球圖像識別挑戰賽的冠軍。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:對於時尚領域來講,如果潮流發生變化,那碼隆這種基於數據通過深度學習的方式會不會很難追趕上潮流呢。

黃鼎隆:其實你說的恰好是這個技術現在能發揮它優勢的地方。比方說我們和中國紡織信息中心合作推出了一個產品叫作AI color trend。這是全球第一個用人工智能去分析和預測流行色彩的趨勢。中國紡織信息中心作為中國流行趨勢的官方機構,過去發佈報告的過程,就是要組織一些時尚專家,去看一些全球知名的時裝秀,再花很長時間去總結。

未來圖靈:這樣看來的話,似乎行業專家也要失業了?

黃鼎隆:首先我不太贊成AI去取代誰的工作,我們覺得AI是去增強人的工作。其實我們推出來的產品恰恰很受這些時裝設計師的歡迎,因為他們可以通過這項技術更快更高效地去分析,技術可以幫助他們提升效率。同時我們覺得技術的進步永遠是可能對某些工作有影響,但同時也會帶來更多的機會。

未來圖靈:說到商品識別能力,不得不提到一個現在依然困擾著很多人的假貨問題。對於碼隆來說,開發這種視覺技術,同時也試想了一個很完美的未來消費途徑,有沒有想過怎麼解決假貨問題這個話題?

黃鼎隆:首先需要強調的是,肯定不會是開發一個人工智能工具就可以直接判斷其真假了,並不會這麼簡單。從技術角度說,短期內也是不現實的。但是我覺得人工智能技術作用在於重塑了整條供應鏈,使得假貨製造者無利可圖了。比如技術使得整條供應鏈更加高效,製造企業可以直接觸達消費者,中間也就沒有了假貨流通環節,這種情況下自然也就沒有假貨了。

碼隆科技黃鼎隆:商品識別比人臉識別難,解決假貨當從供應鏈入手

未來圖靈:對於2028年,您預測科技行業會發生什麼現在不可想象的事情。

黃鼎隆:手機。目前手機的交互方式其實非常艱難,我不認為它還會持續十年。但是很難說會出現什麼樣的交互方式,可能是AR,可能是可穿戴式設備。不論是哪種設備,它一定會有一個特徵,即以視覺為主要的交互方式。


分享到:


相關文章: