一.機器學習流程: 1.選擇算法 2.數據預處理(歸一化,標準化,特徵選擇) 【】Spark 特徵工程總結 3.把參數分區間,一步一步進行調試 4.交叉校驗找出最好的參數 (原始數據分為訓練集和測試集,用訓練集使用交叉校驗得到最好的模型,再在測試集上校驗) 5.再使用所有的數據跑出最終模型 分享到: 閱讀更多 從大數據說起 的文章 關鍵字: 流程 參數 技術