讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

人臉識別已經被廣泛應用在各個領域,但當新冠肺炎來襲的時候,戴著口罩的你如何證明你是你?

發現一個犯罪嫌疑人,但是視頻沒有捕捉到他的臉。能不能通過衣服的顏色、布料的紋理,查找相似的ID?

有違章或是犯罪行為的車輛,往往會遮擋號牌或是使用套牌,那麼用車牌號就不能正確辨識車輛的身份,能不能通過更細緻的外觀把它找出來?

視頻識別在我們現實中的應用越來越廣泛,很多我們想得到的、想不到的,AI已經帶給我們越來越多的驚喜與驚歎。但,這也都是在進程當中,現實的應用場景對AI不斷提出更高的挑戰:以前只要能識別人臉就可以了,現在你要能識別戴口罩的人;以前通過人臉照片追查罪犯,現在看不到臉也能把他找出來;以前通過車牌號碼辨別車輛身份,現在則要通過車身細節去追蹤……

“人們往往高估一項技術的短期表現,而低估一項技術的長期表現。” 已經從事17年計算機視覺研究的格靈深瞳信息技術有限公司CTO鄧亞峰深有體會,AI是一個長跑,自己的實力很重要,陪伴的夥伴也很重要。


關於AI,我們常常聽到智慧城市、機器人、自動駕駛、智慧醫療、工業視覺、AR等,這些都是AI的應用場景。如果說到AI的核心技術,主要是三個方向:

計算機視覺、語音識別、自然語言理解。也就是說,在三個技術方向上的深入,可以應用到各種場景當中去發揮價值。

讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

在我們人類物理世界來看,視覺可以佔到人體各種感覺器官接受信息的80%。所以,視覺是人與外界溝通最重要的途徑。同樣,在數字世界裡,計算機視覺的發展也決定著AI的走向與能力。“計算機視覺是智慧物聯網時代最大的數據入口,擁有廣闊的應用場景。” 格靈深瞳信息技術有限公司CTO鄧亞峰表示,無論智慧城市、機器人、自動駕駛、智慧醫療、智能製造,所有這些應都離不開計算機視覺這一項AI基礎技術。

在智慧城市的應用中,可以通過人的行為軌跡分析找線索、發現規律,甚至提前預知異常。比如某個人白天不出門,經常是後半夜出門,而且行為軌跡也不是去某個固定的工作場所,那麼這個人就有可能是犯罪嫌疑人。

再比如在智能商業應用中,通過人臉識別將同一個人多次到店關聯起來,利用人臉將商品購買記錄關聯起來,並形成動線和熱力圖。有時候,通過海量數據彙集後,AI真的可以“比你更瞭解你”。

“看見”這個世界並不能,但“看懂”這個世界卻非常難。在中國現在有近2億的安防攝像頭,但其產生的視頻數據有80%是冗餘信息。AI如何通過深度學習、高性能運算及大數據技術,在這些數據中篩出有用的價值。


格靈深瞳就是一家以“讓計算機看懂世界”為願景的公司。他們與華為聯合打造的全目標結構化系統,集結構化分析、數據存儲、數據應用於一體的高性能、高密度計算系統,以解決對人體、機動車、非機動車、人臉等全目標的特徵識別和快速檢索。其主要功能包括目標檢測、跟蹤、分類、全目標特徵識別、以圖搜圖、軌跡分析、綜合布控、違法分析等應用。這個系統能夠有效處理大規模視頻數據,將廣泛具備併發能力強、分析識別準、運算速度快、檢索效率高等優勢,可實現預警、布控、研判等多種應用,提高辦案效率。應用於包括智慧城市、公共安全領域各類場景。


單機實現384路極致高密視頻實時分析,支持圖片分析(檢測、結構化、特徵提取)不低於1200張/秒——這些聽起來不明覺厲的技術,是如何在高效的機器視覺系統上實現的呢?

一般來講,高效的機器視覺系統取決於四個關鍵因素:一是核心算法,二是自動化大規模訓練模式,三是智能數據挖掘和標註,四是基於硬件平臺的計算優化。

讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

如上圖,在傳統的算法開發模式中,工程師把大量的時間都放在處理參數等這些基礎工作上,而真正能發揮其價值的時間佔比很少。同時,機器的GPU利用率低,硬件無法充分發揮其效能。形成了對人才價值和機器價值的雙重浪費。

再看改進後的開發模式,通過設計與開發工具,幫助更好的收集和處理數據,工程師把數據、框架、計算資源都管理起來,使得訓練的效率、資源的使用效率都非常高,工程師的時間都用要高價值的工作內容上。

“通過虛擬化的環境,系統把運算資源、存儲資源運用得更為高效,讓算法工程師的工作變得簡單而極致。” 鄧亞峰總結到。

從前後兩種開發模式對比來看,差別就在於一套大規模訓練平臺。“大部分公司沒必要重新造輪子。”在鄧亞峰看來,打造一個高效的大規模訓練平臺就相當於那個“輪子”,把算法工程師從大量的低端重複性工作中拯救出來。

讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

那麼又如構建一個通用又高效的輪子呢?格靈深瞳用了“數據並行+模型並行”的方式。簡單來講就是把數據和模型分配到不同的機器上去運行,通過巧妙的分割、設計,使得不同機器間數據交換量比較少,平行拓展計算資源,從而實現非常高的訓練效率。

這恰好就是深瞳大腦的設計思路:構建從“數據->標註->算法->訓練->產品->數據”

的一個正循環,在這個訓練框架裡可以支持上百卡的集群訓練、支持上億類別任務訓練、支持多達上百層以及數十億參數的深度學習模型。“終極目標是工程師做完這個框架,標註好數據,系統就會算出一個完美的結果。”鄧亞峰表示。


前面講過,高效的機器視覺系統有四個關鍵因素,其中前三個都是與框架相關的,是靠內部工程師的智慧來解決,而第四個則是如何藉助外力,選擇最好的“夥伴”,鄧亞峰認為這一點極其重要:“如何選擇平臺,把計算做到極到,這跟效率和成本都是密切相關的。”

華為Atlas、海思NNIE、Movidius、TPU、NPU……對於工程師而言,當前市場上的選擇比較多。鄧亞峰給出幾個重要的考量標準:性價比如何?開發成本如何?能否提供一整套完整的接口和框架?生態的持續性如何?

在他看來,平臺的完整性和生態的可持續性非常重要。首先,多平臺開發和維護成本很高。如果一個平臺不具備雲、端、側完整的能力,那麼工程師就需要開發多平臺、維護多平臺。增加一個新平臺,不僅資金成本增加,關鍵是時間成本可能是企業不能承受的。所以,選擇具備雲、端、側完整能力的平臺可以減少很多不必要的重複工作。其次,要選擇一個立足於長遠發展的生態。如果生態沒有保障,那麼可能很多前期的投入就會全部作廢,這是更可怕的事情。

讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

正是基於這樣的思考,格靈深瞳選擇了鯤鵬處理器+Atlas 300加速卡,結合自創的業界領先的全目標(人臉、人體、車輛、非機動車)結構化算法,搭建了自己的平臺,通過系統調度、推理流水線優化、內存優化,最終實現單卡支持48路視頻結構化,64路人臉識別。單機可以提供實現384路極致高密視頻實時分析。這其中Atlas 300 AI加速卡是一個“關鍵先生”,基於昇騰310和910 AI處理器的Atlas 300 AI加速卡提供多種數據精度,適用於人工智能訓練和推理場景。

“我們業務的特點是模型非常多,各種各樣的處理需求複雜。Atlas 300有非常多的資源。” 鄧亞峰對雙方聯合打造的解決方案非常滿意,“這已經是行業內非常領先的一個結果。”

華為人工智能計算平臺以強大的算力,有云、邊、端豐富的產品,使得綜合成本更低。鄧亞峰認為更為重要的原因是,華為在生態上有非常大的決心去投入,“我們開發中間也遇到一些困難,華為非常積極地支持我們,跟我們一起聯調。

格靈深瞳去年參加了行業最具挑戰的“非約束性自然環境人臉照片”測試項目,根據全球最權威的人臉識別算法測試(FRVT)公佈的結果來看,格靈深瞳獲得了全球第一名的成績。此外,在2019年北京市交管局組織的第一屆交通行為圖像智能識別技術競賽中,格靈深瞳的行為識別算法也獲得了全國總排名第一的佳績。

在懂懂看來,讓格靈深瞳之所以選擇華為,主要是兩個原因:

第一,華為Atlas智能計算平臺的強算力和完整性。這是基於華為昇騰系列AI處理器和業界主層異構計算部件,通過模塊、板卡、小站、服務器、集群豐富的產品形態,打造面向“端、邊、雲”的全場景AI基礎設施方案,可廣泛用於平安城市、智能交通、智慧醫療、AI推理等領域。

第二,是華為開放的生態以及對生態夥伴不遺餘力的支持。華為Atlas智能計算平臺支持業界主流框架,方便易用的代碼遷移和模型轉換工具,通過靈活的合作方式與業界ISV共建、共贏。也就是說,選擇了華為Atlas智能計算平臺,就是選擇了一個開放的標準,選擇了更多的合作伙伴,選擇了更多的機會。

讓計算機看懂世界的格靈深瞳與華為Atlas AI的故事

如果人工智能是一場長跑,那麼選擇一個最好的合作伙伴才是跑到終點的必要條件。對於格靈深瞳而言,華為Atlas人工智能計算平臺就是那個陪伴的“關鍵先生”。


分享到:


相關文章: