編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

26日,由新華社和阿里巴巴強強聯手成立,素有“

技術公司裡最懂媒體、媒體公司裡最懂技術”之稱的新華智雲,一下子發佈了25款媒體機器人。據說這些機器人將被主要運用於採集和處理新聞資源,覆蓋到了新聞生產的全產業鏈。

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

機器人美女主播

媽媽咪啊,小博看到此新聞,不禁驚呼:“這年頭不懂點人工智能的知識,靠啥子跟這些機器人耍噻?”想一想,還是得沉下心學點人工智能的知識,畢竟“知己知彼”,才能“百戰不殆”。

那今天學點什麼呢?先來碟小菜,看看人工智能裡“分類”的概念。

日常生活中的“分類”,是什麼意思呢?顧名思義,“分類”就是分門別類,將事物按照種類、等級或性質的不同歸入各種門類。比如飲料根據是否含酒精分為酒精飲料和無酒精飲料(軟飲料),軟飲料按照原料和加工工藝的不同,又可以分為碳酸飲料、果汁及其飲料、蔬菜汁及其飲料、植物蛋白質飲料等。

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

其實,人工智能領域裡的“分類”的概念也大同小異。人工智能系統要處理各種各樣的數據,最簡單的一個操作就是“分類”;“分類”就是要根據所給數據的不同特點,判斷它屬於哪個類別。下面我們來講講最基本的一種分類任務,即二元分類——對兩類物體進行分類。下面舉個例子:

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

我國由於幅員遼闊,自然條件差異較大,因此各地都形成了獨特的板栗樹資源,按大類主要分為北方慄和南方慄。那麼,人工智能拿到一顆栗子,是怎麼區分它是什麼品種的栗子的呢?

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

其實人工智能系統判斷栗子品種的過程很簡單,如上圖所示:

1)拿到一顆栗子,要先提取它的某些代表性的特徵。比如大家都知道北方慄個頭小,但是含糖量很高,而南方慄個頭大但是含糖量相對較低,咱們就可以提取單粒重量和含糖量這兩個特徵;

2)把單粒重量和含糖量兩個特徵輸入到事先用數據訓練好的

分類器中;

3)分類器就能根據栗子的這些特徵來做出預測,然後輸出板栗的種類,確定它是南方慄,還是北方慄。

什麼是分類器呢?這個能像人一樣快速識別出栗子品種,善於完成分類任務的人工智能系統,就被稱為“分類器”。它的作用就是將提取的特徵量和事物歸屬的類別意義對應起來。手機上有一款軟件叫作“形色”,根據植物的花朵或葉片的特徵,就能知道它叫什麼名字,用的就是“分類器”。

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

可是“分類器”感覺好抽象啊,畢竟它不像棋盤上的楚河漢界那樣實實在在、亙古不變,機器怎麼知道這個分類的標準什麼呢,分類的紅線又該畫在什麼地方?大家完全不用擔心這個問題,其實機器像人一樣通過學習,就能憑經驗對未知事物進行有效地判斷和分類。只是對機器人來說,這前期的學習不依賴於課本和學校老師,而是一些數據。通過算法得當的訓練,人工智能自己就能得到一些準確率高的分類器,並將其應用於未來的場景中

編輯部都用上機器人了!還不趕快學點人工智能——什麼叫“分類”

常見的用於訓練二元分類器的算法模型,小博能想到的主要有:1)Logistic迴歸;2)支持向量機(SVM);3)感知機(Perceptron)。有了它們,你就能快速的知道分類的紅線到底怎麼畫,應該畫在哪,河南產的栗子屬不屬於南方慄。有志向的同志可以自行去找相關資料瞭解一下,數學模型不難,涉及到部分高中函數、解析幾何和概率部分的知識,咬咬牙就看懂了。


分享到:


相關文章: