當設計一個人工智能時,數據、算法和處理哪個環節最重要?

当设计一个人工智能时,数据、算法和处理哪个环节最重要?

一個人工智能項目中,最重要的究竟是數據、算法還是處理過程?

有人認為,數據就宛如人工智能的汽油,重點應該是乾淨的數據、數據科學和對數據含義的深刻理解。

有些人說,沒有來龍去脈的數據是沒有意義的,這些數據的來龍去脈可以是其他數據、模型/算法或處理流程。

讓我們以一種簡潔的方式探究這些人工智能的要素,以發現每種視角的優點。

數據

數據是起點,因為它是非常有用的資產。

不管真假,人們都認為數據承載著知識,而利用這些知識將有利於那些善於研究數據的人。

對人工智能來說,從數據開始,並通過從中學習來利用優勢,是有意義的。在數據量大、速度快的時代,使用數據來訓練人工智能十分便捷。

企業在商業智能方面有著悠久的歷史,很多工作都圍繞著數據展開。對於人工智能來說也沒什麼不同。

原始數據一般通過數據採集獲得,隨後的數據清洗、數據標註相當於對數據進行加工,然後輸送到人工智能算法和模型裡進行調用。

人工智能訓練所用的數據如果沒有保證足夠的多樣化和無偏性,就有可能產生人為的“AI偏見”等問題。

國內的京東眾智、百度眾包、阿里眾包等都是專注於AI數據的智能眾包平臺。

算法

理解算法相對於自然環境下的靜態數據的優勢是很重要的。

事實上,組織可以通過優化其業務的算法獲得優勢。找到合適的公式、統計模型或預測是真正的商業藝術。

這些算法受到組織的保護,通常被認為是成功的秘密武器。

雖然它們依賴於乾淨的數據,但數學或邏輯中隱含的規則才是許多行業的真正區別所在。

如果沒有精算師和他們寶貴的算法,保險業將何去何從?人工智能也不例外。

機器學習的常用算法包括決策樹、隨機森林算法、邏輯迴歸、SVM、樸素貝葉斯、K最近鄰算法、K均值算法、Adaboost算法、神經網絡、馬爾可夫。

人工智能的算法按照模型訓練方式和解決任務的不同可以分為好幾類,其中需要考慮的因素包括數據本身的數量、質量和特點,具體業務場景中的問題,計算時間及精度要求等。

處理過程

正確的步驟或任務、適當的方式對於取得的結果質量是至關重要的。

無論處理過程(process)是靜態的、可重複的,還是動態的、緊急的,都沒有區別。

知道下一步的最佳行動是獲得最佳業務結果的關鍵。

好的處理過程就是在正確的時間使用正確的數據和算法。

由於流程的精確性,業務結果肯定是準確的,並且可以通過使用各種形式的監督的透明反饋週期進行適當的調整。

三者缺一不可?

真正的結論是,要想獲得長期的成功,你需要這三者。人們可以先從其中一個要素開始,接著添加其他要素。

隨著機器學習逐漸展現出其威力,許多人工智能項目都是從數據開始的。

但隨著人工智能的發展,算法和處理過程也將成為不可忽視的要素。

基於數據的人工智能目前運行良好,隨著問題的複雜性和範圍的擴大,算法和處理流程的重要性將會凸顯。

如同三角形需要三條邊來穩定形狀,人工智能也將需要全部的三要素來完善自身。


分享到:


相關文章: