人工智慧之機器學習該怎麼入門?

“機器學習”在最近雖可能不至於到人盡皆知的程度,卻也是非常火熱的詞彙。機器學習是英文單詞“Machine Learning”(簡稱ML)的直譯,從字面上便說明了這門技術是讓機器進行“學習”的技術。然而我們知道機器終究是死的,所謂的“學習”歸根結底亦只是人類“賦予”機器的一系列運算。這個“賦予”的過程可以有很多種實現,而Python正是其中相對容易上手、同時性能又相當不錯的一門語言。

機器學習 機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。機器學習算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法。

人工智能之機器學習該怎麼入門?

程序語言機器學習入門最佳的方法其實就是理論和代碼一起學習。一邊看相應的理論推導,一邊看並且實踐經典代碼。所以,為了更快入門,我推薦你最好能夠懂點MATLAB或者是Python語言。Matlab和Python說實話做高端的機器學習肯定是不推薦的,但是如果你想的是機器學習快速入門,那這兩門語言絕對是絕佳選擇。

機器學習常用術語

“數據集”(Data Set),就是數據的集合的意思。其中,每一條單獨的數據被稱為“樣本”(Sample)。若沒有進行特殊說明,本書都會假設數據集中樣本之間在各種意義下相互獨立。事實上,除了某些特殊的模型(如隱馬爾可夫模型和條件隨機場),該假設在大多數場景下都是相當合理的。

對於每個樣本,它通常具有一些“屬性”(Attribute)或者說“特徵”(Feature),特徵所具體取的值就被稱為“特徵值”(Feature Value)。

人工智能之機器學習該怎麼入門?

特徵和樣本所張成的空間被稱為“特徵空間”(Feature Space)和“樣本空間”(Sample Space),可以把它們簡單地理解為特徵和樣本“可能存在的空間”。

相對應的,我們有“標籤空間”(Label Space),它描述了模型的輸出“可能存在的空間”;當模型是分類器時,我們通常會稱之為“類別空間”。

尚學堂立志解決中國教育不公平和低效率問題,幫助千千萬萬被傳統教育方式耽誤的人,傳授實用、前沿的知識,成就學員個人理想,為愛你的人和你愛的人創造美好的生活。尚學堂12大精英團隊+各類實戰項目,真正實現1+1>10的目標效果。幫助學員迅速成長,持久騰飛,成就學員“高富帥”人生。


分享到:


相關文章: