數據標註正在成為一個高新職業

數據標註,顧名思義,就是給數據打標籤或者給數據做標記。它是數據清洗後的一道重要工序。

目前的人工智能算法由數據驅動,一個好的模型就需要質量優異的數據資源進行訓練。數據又可以分為帶標籤數據和無標籤數據(原始數據),而當前性能優良的算法以深度學習為代表的算法都需要海量帶標籤數據進行訓練。因此,數據標註質量直接影響著模型性能,因此數據標註對於人工智能應用非常重要。

數據標註主要包括文本標註、圖片標註、視頻標註、關節點標註等。數據標註的基本數據類型包括文本、圖片、視頻、語音、數值型數據。其中,文本標註,根據文本長度可以分為短文本標註、篇章文本標註,應用於輿情監測、垃圾短信分類等領域。視頻標註的數據主要應用於視頻監控、人臉識別、自動駕駛等領域。其他的類型也有對應的應用場景。

目前社會上有眾多的小型數據標註公司為一些大型的互聯網公司提供數據標註外包服務,但整個數據標註行業仍在發展中。隨著越來越多的大中專學生進入這個行業工作,數據標註正在成為一種新興的高新就業崗位。


分享到:


相關文章: