追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

編者按:美東時間2020 年 4 月 25 日夜間,計算機視覺之父,華人視覺一代宗師 Thomas S.Huang(黃煦濤)去世,享年 84 歲。

黃煦濤先生一生成果頗豐,且終其一生嚴謹為學、寬厚為師、謙遜為人,培養和影響了無數後輩學者。

著名學者,ACM/IEEE Fellow, 騰訊AI Lab和騰訊Robotics X實驗室主任張正友博士,也正是其中一位。雖不為黃門弟子,其學術生涯卻仍受到極大影響,由此也可見一斑。

下面我們轉發一篇張正友博士於 2016 年慶祝Thomas S. Huang 八十大壽的發言稿,以示紀念。

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

追尋大師的腳步

第一次認識Thomas S. Huang和他太太Margaret是1988年,他們來我所在的法國INRIA實驗室訪問。Tom在計算機視覺和信號處理領域已經是上帝一樣的存在,而我剛開始讀博士還不到一年,但Tom平易近人,睿智儒雅,三十多年來一直是我生命中高山仰止的豐碑。現重發2016年慶祝Tom八十大壽的發言稿,回顧了Tom對我學術生涯的影響,以此紀念。

感恩Tom家人的大愛,昨天在Tom去世前給我們機會和Tom視頻話別。Tom,你追隨Margaret而去,你們肯定會在天國相會,攜手永伴。Tom,一路走好!R.I.P. ???

------------------------------------

2016年10月1日,伊利諾大學Beckman Institute和電機與計算機工程系聯合舉辦Dr. Thomas S. Huang黃煦濤教授八十壽辰學術研討會,我很榮幸列席。我和Tom自1988年相識並開始學術交集,他作為計算機視覺界和信號處理界的先驅智者,以他獨有的洞見和卓越的學術成就,給了我不計其數的啟發,鼓勵和支持。Tom學術家族樹已經數代,根深葉茂,畢業的博士生迄今已有一百多位,其中不乏我的實習生,而他們的學生也有不少還是我的實習生,真可謂薪火相傳,不知其盡也。

研討會當天,我被安排做一個簡短的發言,目光所觸,看見Tom和濟濟一堂他帶出的學生,想起Tom儘管譽滿天下,參加任何會議仍及其認真嚴肅,從不放鬆專業水準,想起Tom和他太太Margaret多年來對我的支持,不禁觸動了感情,有點哽咽。

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

28年前我是法國國家計算機自動化研究院(INRIA)的一名博士生,和Tom緣起他的一次訪法學術交流,彼時Tom已是國際上計算機視覺界和信號處理界的泰斗。那個時候覺得他赫赫有名卻非常平易近人,對他能把枯燥的學術報告講解的幽默風趣的本領十分敬佩。從那以後,我不時向Tom請教和諮詢學術問題,得他指點迷津和無私提攜。Tom是非常樂意助人的。

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

Tom對我個人學術生涯影響至深,可以溯源到我的博士論文: 那時我為了機器人導航在做三眼立體視覺的運動估計。Tom在從事從二維到二維特徵對應估計運動和從運動中決定三維結構(Structure from Motion)的研究工作,現在在機器人領域叫SLAM(Simultaneous Localization And Mapping),Tom可謂是SLAM的先驅。特別值得指出的是,Tom和他的學生R. Y. Tsai在1981年發表的文章“Estimating3-D Motion Parameters of a Rigid Planar Patch”是Structure from Motion領域的開山之作。當時我有個想法,就是把Tom做的東西實現一下來解決我的問題。為此我開始讀Tom的一篇論文,題目是“Some Properties of the E Matrix in Two-View Motion Estimation”。這是Tom在1989年發表於IEEE Transactions on Pattern Recognition and Machine Intelligence上的一篇經典的很有影響力的文章。

我很快發現我理解不了Tom的文章 :-),太多的公式讓我腦袋爆炸了。我因而將我的博士論文轉向解決一個更簡單的問題:從三維到三維特徵對應來估計運動。三維特徵可以用我們的三眼立體視覺系統裡提取出來,我的博士論文的問題可以描述如下:

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

這是一個帶六個約束條件的線性方程。但我也清楚,這個問題太簡單,不足於寫成一篇博士論文。我於是試圖從多方面探討研究這個領域,包括:數據不定性;參數估計魯棒性;運動分割;短序列匹配;長序列跟蹤;等等。寫成了320頁的長篇博士論文。

我博士論文答辯還有一個小插曲:答辯委員會里一個很有名的教授指責我說不誠實,所有人都大吃一驚,包括我的博士導師。追問原因,他拿著我厚厚的論文說:“你沒有指明哪些部分是你的工作。”原來他不相信論文裡的工作都是我自己完成的。我認為這是對我博士論文的褒獎。

恰在此時,我注意到Tom正在編輯“Springer Series in Information Sciences”從書。我冒昧去信問Tom:我的博士論文值不值得作為一本專著在他編輯的叢書上發表?結果就是我的博士論文被修編成了我的第一本書《3D Dynamic Scene Analysis》。

直到多年以後我終於讀懂了Tom 的文章,把那些公式理清楚了。根據這些基本原理,我推而廣之,將之應用到未標定的攝像機,將算法魯棒化,開發了圖像自動匹配技術,發明了攝像機標定新算法,也據此發表了我的第二部專著《Epipolar Geometry in Stereo, Motion, and Object Recognition: A Unified Approach》。

感謝從Tom那裡得到的靈感,我因此發表了一系列相關論文,其中包括髮表在1999年ICCV上關於攝像機標定法的文章。2005年,我慶幸當選 IEEE Fellow。在北京舉行的 ICCV 2005 晚宴上,Tom 親手頒證書給我,真的沒有比他更加合適的頒獎人啦!

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

在經歷了個人學術研究的一個小“巔峰”之後,我開始尋找下一步的研究方向。Tom是我長久以來的學術導航燈,很自然的我開始集中閱讀Tom實驗室發表的論文。我發現了他已經在人臉建模、人臉表情識別和視頻會議三方面發表了許多前瞻性的文章,立刻決定開始進行這三方面的研究。

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

人臉建模。

Tom在3D人臉建模方面早在90年代初就有很多先驅的研究,比如用樣條曲面來表達3D人臉,來進行人臉非剛性運動的估計,和Facial action units的提取,以及voice-driven avatar的研究。

我從1999年開始做用Web Cam視頻對人臉三維建模,通過基於幾何和外觀模型擬合的方法進行多方位的研究,使得即使在低分別率和弱光照下也能魯棒建模。多次的實時演示中,我和我的團隊成功給很多人包括Bill Gates 和 Andy Grove 建模,其中部分技術在微軟的產品Xbox落地。這些在我的專著裡均有詳細介紹(Z. Liu and Z. Zhang,Face Geometry and Appearance Modeling,劍橋大學出版社2011年出版)。

人臉表情識別。

Tom是人臉表情識別的先驅,早在90年代初就開始表情識別的研究。當時他的工作除了基於單幅圖像的appearance-based方法以外,更有基於連續圖像序列motion-based的方法。這些研究都是後世研究的基礎。

1996年底我在日本國際電氣通訊基礎技術研究所(ATR)學術休假時開始做的。那時我已經在幾何領域做了10年的研究,很希望能在機器學習方面有所拓寬,最終將幾何和機器學習結合起來。在ATR有不少人做人臉表情識別,而且有些現成的標記好的數據,但主要側重從心理學和認知科學角度研究。我認真的讀了Chris Bishop 的《Neural Networks for Pattern Recognition》,編了一些神經網絡的算法,將它應用到人臉表情識別,說起來在這領域起步也是相當早的。最近兩年和微軟同事一起利用大數據和深度神經網絡開發了自動的表情識別技術,已經用在微軟的Cognitive Services上了。

視頻會議。

這是個多學科綜合性多媒體系統工程。Tom在視頻會議上的研究早在80年就已經是這個領域的帶頭人了。他在圖像視頻壓縮的貢獻是無以倫比的。他在90年代開始了very low bit-rate communication system的研究,基本思想就是從視頻中計算物體的剛性和非剛性的運動,以及物體的3D建模,只用在通信系統中傳輸編碼的運動參數,然後在接收端用運動參數驅動3D模型,這樣能實現超低比特率的視頻通信。

我的研究方向自2001年起有很大轉變,開始做語音處理,麥克風陣列,多聲道聲學回聲消除,自然人機交互,全息三維重建,沉浸式遠程臨場系統等研究工作。有些技術已經授權給Polycom的CX5500 Unified Conference Station 和微軟的Skype Room System。這是一個很令人激動的領域,能夠釋放人的潛力,大大增強社會的生產力,期待更多的技術革新和產品創新。

2014年,因為對計算機視覺和多媒體的貢獻,我很榮幸的當選ACM Fellow。回想自己的職業成長和學術進步,我十分感激Tom對我的幫助和支持!從一個對電子和計算機深感興趣的年輕人到算是略有建樹的研究者 ,我因循著Tom的足跡一路走來。現代醫藥學之父,古希臘醫者 Hippocrates 曾經說過:Life is short. The art is long. 這句話用來形容Tom一點不錯。他為人師為人友,桃李滿天下,學術精神永存!

這是我送給Tom的賀卡,感謝Tom和Margaret二十八年來對我的支持,祝願Tom身體健康,闔家幸福!

追尋大師的腳步 | 張正友憶華人計算機視覺宗師 Thomas S. Huang

作者簡介:

Zhengyou Zhang received the B.S. degree in electronic engineering from Zhejiang University, Hangzhou, China, in 1985, the M.S. degree in computer science from the University of Nancy, Nancy, France, in 1987, and the Ph.D. degree in computer science in 1990 and the Doctorate of Science (Habilitation à diriger des recherches) in 1994 from the Universityof Paris XI, Paris, France.

He is a Principal Researcher and Research Manager with Microsoft Research, Redmond, WA,USA. He was a Senior Research Scientist with INRIA (French National Institutefor Research in Computer Science and Control), France, and spent a one-year sabbatical as an Invited Researcher with the Advanced Telecommunications Research Institute International (ATR), Kyoto, Japan. He has published over 250 papers in refereed international journals and conferences, and has coauthored five books. He is an inventor of more than 130 issued patents, and has received 8 Ship-It Awards at Microsoft.

Dr. Zhang is an IEEE Fellow, an ACM Fellow, the Founding Editor-in-Chief of the IEEE Transactions on Autonomous Mental Development, and an Area Editor of the Journal of Computer Science and Technology. He served as Associate Editor for the IEEE Transactions on Pattern Analysis and Machine Intelligence, the IEEETransactions on Multimedia, the IEEETransactions on Circuits and Systems for Video Technology, the International Journal of Computer Vision, the Machine Vision and Applications journal, and the International Journal of Pattern Recognition and Artificial Intelligence. He is on the Honorary Board of the International Journal of Computer Vision, and on the Steering Committee of the Machine Vision and Applications. He is serving as a General Chair of IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2017. He received the IEEE Helmholtz Test of Time Award at ICCV 2013 for his paper published in 1999 on camera calibration, now known as Zhang’s method.

雷鋒網雷鋒網雷鋒網


分享到:


相關文章: