毋庸置疑的是,人工智能領域每天都在上演著日新月異的發展和進步。
當我們打開手機,啟用美顏APP裡各種各樣的AI濾鏡時,我們看到的是搞笑的頭像和可愛的表情,而APP“看到”的是我們臉上數百個點。
我們早已對各類的AI濾鏡習以為常,但卻甚少思考這些APP究竟是怎樣識別出哪裡是眼睛,哪裡是鼻子。
其實這一切都歸功於AI時代最可愛卻最容易被忽視的一群人,他們就是被稱為人工智能“老師”的數據標註員。
人工智能背後的人工
早上8點30分,小新打開了名為“數據標註分配任務群”的QQ群,開始了一上午的工作。
群主早已將今天需要標註的視頻和圖片發到群裡,小新被分配到的是一段長達3個小時的視頻錄像。
這是一段某口腔醫學院老師講課時錄製的視頻,視頻的內容主要是針對口腔齲齒的介紹分類,小新的主要任務就是在視頻中找到黑色的齲齒,然後用鼠標將齲齒周圍畫一個數字“邊界線”,從而將它標註出來。
同樣的動作小新一上午要重複幾百次,直到視頻播放結束,最後小新會將標註好的新視頻重新反饋到群裡,結束一上午的工作。
小新並不是醫學專業出身,他也不太清楚這些被標註的齲齒部分到底有何作用。但在無形之中小新卻成了人工智能醫療系統的“老師”,通過大量的數據迭代讓AI可以準確識別出哪些是齲齒,齲齒腐爛的程度等。
小新或許從沒聽說過“數據標註”這個職業,但他卻用實際行動日復一日履行著一個數據標註員的責任,讓機器通過大量的資料學習,直到它們順利“畢業”。
大浪潮之下的普通人
近2年數據標註公司開始在國內大規模興起,這與中國人工智能發展初期所需要的大量的數據密不可分。
由於科技公司所需要的數據量巨大,數據標註公司會把很大一部分標註工作分包出去,數據浪潮讓AI更智能的同時也帶來了大量的就業機會。
在距離貴陽市中心50公里的百鳥河數字小鎮,就有一個規模500人的“數據工場”,500名標註員中,近一半是附近一家扶貧高職的學生。
據瞭解,他們一個月能掙到1500元,經濟上足以自立,還能補貼家用,相比餐廳辛苦端盤子或者送外賣這類兼職工作,數據標註相對輕鬆且體面。
數據浪潮的滾滾洪流席捲著資金和技術,裹挾著無數夢想與野心向前奔騰,在資本和野心之下無數普通人雖然暫時不理解這些變化,但卻能從變化中獲得便捷和利益。
關於我們不知道的故事
對於絕大部分同學來說“數據標註”是一個陌生又專業的名詞,班主任也是第一次和大家提起這方面的知識。其實圍繞數據標註還有很多有意思的話題,比如數據標註的分類,數據標註產業的發展和影響,數據標註到底是不是完全依賴人類…..
為了讓大家更深入更全面的瞭解數據標註,AI大學第26期科技晚自習特意邀請到了科大訊飛AI資源部語音數據主管劉丹,在12月12日晚19點來到AI大學直播間和同學們一起聊聊關於數據標註背後的故事。
【課程主題】
一個未被講出的故事——數據標註
【課程講師】
科大訊飛AI資源部語音數據主管 劉丹
【課程時間】
2019年12月12日19點(本週四)
【課程鏈接】
關注公眾號“AI研究所”點擊“晚自習”進入課程
閱讀更多 AI研究所 的文章