揭祕「吻戲鑑定師」


29歲的吉恆杉坐在電腦前,手指輕輕點擊鼠標,將屏幕上成百上千幅內容各異的畫面標註成兩類——“接吻”和“非接吻”。作為優酷的一名人工智能標註員,他正在訓練機器識別何為“接吻”鏡頭,因此也被戲稱為“吻戲鑑定師”。中新社發 許康平

吉恆杉畢業於北京航空航天大學,碩士學的是計算機視覺,通俗地講,這個專業的目的是“教電腦看懂世界”。去年9月他加入優酷成為一名高級算法工程師,目前的主要工作是教計算機識別接吻、牽手等場景。“這個崗位給大家傳遞快樂和幸福,又能以工作的名義看網劇綜藝,我特別喜歡。”談起自己的工作,吉恆杉一臉笑容。“剛開始我和女朋友說,我的工作是訓練計算機識別出吻戲鏡頭,她聽完覺得特別不可思議。中新社發 許康平

2018年8月9日消息,人工智能和視頻黑科技的應用,不僅提升了用戶觀看體驗,更催生出眾多炫酷的新就業崗位:吻戲鑑定師、明星標註師、射門投籃視頻分析員等等……既對娛樂、體育感興趣又精通技術的“程序猿”,成為視頻網站最緊缺的人才,也折射出新經濟、數字經濟崛起帶來的就業新變化。中新社發 許康平


男女主角的“吻戲”傳遞出美好和幸福,一般是劇情發展的高潮,因此成為劇集中最常見的標籤,如何教機器識別接吻成了吉恆杉和同事們首要的難題。 這項看上去高冷的人工智能黑科技,在最初的環節真的需要不少“人工”。吉恆杉從圖片庫和視頻中截出數千幅圖片,從中一張一張標註出“接吻”的畫面,最多時一天標註上千張。通常數據標註得越準確、數量越多,模型的效果就越好。中新社發 許康平

截止目前,吉恆杉和同事們已經為2萬多條“吻戲”打上了標籤。 有阿里巴巴的技術實力加持,目前,5分鐘時長的視頻全鏈路處理可在10秒內完成。比如劇集《三生三世十里桃花》,每一集50分鐘的視頻被切割成3000幀圖片,機器只需要5秒就能挑出來楊冪和趙又廷的吻戲。 中新社發 許康平

別看這份工作上看去輕鬆有趣,但其中的辛苦只有做過才知道。盯著電腦屏幕一整天,吉恆杉和同事們最輕鬆的時刻是下班後去健身房,或者去公司的“太空艙”按摩,享受片刻閒暇。即便是休息,他腦子裡想的還是如何教機器“鑑別”更多的明星和場景。 中新社發 許康平


比如,現在的明星長得越來越像,如何訓練機器識別古力娜扎和迪麗熱巴,如何分辨TFBOYS的三小隻,需要不斷試錯和反覆進行模型訓練。區分“明星臉”、“網紅臉”、“雙胞胎”,成了吉恆杉和同事們面臨的新挑戰。中新社發 許康平

十年來,我國網絡視頻內容消費用戶達到近6億。用戶的需求不再是簡單地看劇,還想更主動地找到自己最想看的明星或者場景。要想實現搜索和智能編輯,就得訓練機器從海量的素材中找出相應的場景,並打上標籤。中新社發 許康平


分享到:


相關文章: