标签binarize brand_name列。
为item_condition_id和shipping列创建虚拟变量。
创建合并稀疏。
删除文档频率<= 1的功能。
从稀疏合并中分离出训练和测试数据。
为lightgbm创建数据集。
将我们的参数指定为dict。
- 当我们处理回归问题的时候,将“回归”作为应用程序。
- 使用“RMSE”作为指标,因为这是一个回归问题。
- “num_leaves”= 100,因为我们的数据相对较大。
- 使用“max_depth”以避免过度拟合。
- 使用“verbosity”来控制LightGBM的详细程度(<0:致命)。
- 用“learning_rate”确定每棵树对最终结果的影响。
训练开始
训练模型需要参数列表和数据集。训练需要一段时间。
预测
评估
预测的rmse是:0.46164222941613137
源代码可以在Github上找到。(https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/Mercari%20Price%20Suggestion%20Lightgbm.ipynb)
閱讀更多 AI中國 的文章