一份完备的集成学习手册！（附Python代码）

2018-10-11 10:09:08 機器學習與數據挖掘

引言：

试想一下，当你想买一辆新车时，你会直接走到第一家汽车商店，并根据经销商的建议购买一辆车吗？这显然不太可能。

你可能会浏览一些门户网站，在那里查看人们对于不同车型的比较和评论，了解它们的特点和价格。你也可能会向朋友和同事征求一下他们的意见。简而言之，你不会直接给出一个结论，而是会综合考虑其他人的意见再做出决定。

机器学习中的集成模型（Ensemble Models）采用了类似的思想。集成模型结合多个模型的决策，以提高整体性能。这可以通过多种方式来实现，本文将一一介绍。

本文的目的是介绍集成学习的概念，并理解使用这种技术的算法。为了加强您对不同算法的理解，我们将对实际问题的案例使用 Python 来解释这些高级算法。

注意：弄懂本文需要对机器学习算法有一个基本的了解，我建议你通过这篇文章来熟悉一些基本概念：

一份机器学习的自白书

1. 集成学习简介

让我们通过一个例子来理解集成学习的概念。假设你是一个电影导演，你对一个非常重要和有趣的话题都创作了一部电影短片。现在，你想在公映之前对这部电影进行初步的反馈（打分）。该怎么做呢？

A: 你可以咨询一个好朋友来对电影进行打分

这种方法完全有可能会出现一种情况，就是电影很糟糕，但是你的好朋友不忍心伤你的心，因此不会打一星。

B: 你可以咨询 5 位同事来对电影进行打分

这种方法要好些，可以为你的电影提供较诚实的评价。但问题依然存在，这 5 个人可能不是该电影主题的专家，虽然他们可能知道摄影、镜头、音频等一些电影知识。

C: 你可以咨询 50 个人来对电影进行打分

其中一些可能是你的朋友，有些可能是你的同事，有些甚至可能是陌生人。

这种打分方法，反应会更加普遍和多样化，因为打分的人更多更多样了。事实证明，相比 A 和 B，C 更加科学。

通过这些例子，你可以推断出相比一个人的意见，综合多个人的意见可能做出更好的决定。这个例子对于多模型和单模型的比较也是成立的。机器学习中的这种多样化是通过一种称为集成学习的技术实现的。

现在，你已经掌握了集成学习的要点。接下来让我们看看集成学习中的各种技术及其实现方法。

2. 基本的集成技术

在本节中，我们将介绍一些简单但功能强大的技术：

最大化
平均化
加权平均

2.1 最大化

最大化通常用于分类问题。这种技术，所有模型都对该实例进行预测，每个模型的预测都可以看成是一次投票。获得投票数最多的那一类别就是最终的预测结果。

例如刚才的例子，5 个同事给你的电影打分，其中 3 人打了 5 星，2 人打了 4 星。则根据最大化原则，打 5 星的人数更多，最终判断电影评分为 5 星。

示例代码：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict(x_test)
pred2=model2.predict(x_test)
pred3=model3.predict(x_test)
final_pred = np.array([])
for i in range(0,len(x_test)):
 final_pred = np.append(final_pred, mode([pred1[i], pred2[i], pred3[i]]))

或者，你也可以使用 sklearn 库中的 VotingClassifier：

from sklearn.ensemble import VotingClassifier
model1 = LogisticRegression(random_state=1)
model2 = tree.DecisionTreeClassifier(random_state=1)
model = VotingClassifier(estimators=[('lr', model1), ('dt', model2)], voting='hard')
model.fit(x_train,y_train)
model.score(x_test,y_test)

2.2 平均化

类似于最大化投票方法，平均化的做法就是对所有的预测结果求平均值，平均值作为最后的预测结果。平均化可以应用于回归问题的预测或者在分类问题中计算概率值。

还是刚才的例子，5 个同事给你的电影打分，其中 3 人打了 5 星，2 人打了 4 星。则根据平均化原则，计算最终打分为：

(5 + 5 + 5 + 4 + 4) / 5 = 4.6

示例代码：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)
finalpred=(pred1+pred2+pred3)/3

2.3 加权平均

这是平均化方法的一个扩展，所有的模型被赋予不同的权重（定义为在预测中不同模型所占的重要性）。例如，如果你的两个同事在这方面比较专业，那么他们两人的意见所占的比重就更大一些。假设这两人占的比重均为 0.23，其他三人占的比重均为 0.18，则加权平均后的结果为：

5*0.23 + 4*0.23 + 5*0.18 + 4*0.18 + 4*0.18 = 4.41

示例代码：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)
finalpred=(pred1*0.3+pred2*0.3+pred3*0.4)

3. 高级集成技术

上文我们已经了解了基本的集成技术，接下来将介绍一下高级的集成技术。

3.1 Stacking

Stacking 是使用多个模型（例如决策树、KNN、SVM）来构建新的模型的集成技术。该模型在测试集上进行预测。下面是一个简单的 Stacking 集成的详细步骤解释。

1）将训练集划分为 10 个子集。

2）在其中 9 个子集上训练一个基本模型（例如决策树模型），在第 10 个子集上进行测试。遍历每个子集，重复进行 10 次。得到的 DT 长度与 Train set 相同。

3）在整个训练集上使用该模型（决策树）进行建模。

4）使用建模的模型在测试集上进行测试。

5）使用另一种算法（例如 knn），重复步骤 2～4，作用在 Train set 和 Test set 上，得到另一组值。

6）使用得到的 DT 和 knn 组合作为新的特征 TRAIN PREDICTION SET，训练新的模型（例如逻辑回归）。

7）使用训练好的模型对 TEST PREDICTION SET 进行预测。

示例代码：

首先，我们需要定义一个函数对 n 折训练集和测试集进行预测，该函数返回每个模型对训练集和测试集的预测结果。

def Stacking(model,train,y,test,n_fold):
 folds=StratifiedKFold(n_splits=n_fold,random_state=1)
 test_pred=np.empty((test.shape[0],1),float)
 train_pred=np.empty((0,1),float)
 for train_indices,val_indices in folds.split(train,y.values):
 x_train,x_val=train.iloc[train_indices],train.iloc[val_indices]
 y_train,y_val=y.iloc[train_indices],y.iloc[val_indices]
 model.fit(X=x_train,y=y_train)
 train_pred=np.append(train_pred,model.predict(x_val))
 test_pred=np.append(test_pred,model.predict(test))
 return test_pred.reshape(-1,1),train_pred

然后，我们构建两个基本模型：决策树和 knn。

model1 = tree.DecisionTreeClassifier(random_state=1)
test_pred1 ,train_pred1=Stacking(model=model1,n_fold=10, train=x_train,test=x_test,y=y_train)
train_pred1=pd.DataFrame(train_pred1)
test_pred1=pd.DataFrame(test_pred1)

model2 = KNeighborsClassifier()
test_pred2,train_pred2=Stacking(model=model2,n_fold=10,train=x_train,test=x_test,y=y_train)
train_pred2=pd.DataFrame(train_pred2)
test_pred2=pd.DataFrame(test_pred2)

最后，使用逻辑回归，进行训练和预测。

df = pd.concat([train_pred1, train_pred2], axis=1)
df_test = pd.concat([test_pred1, test_pred2], axis=1)
model = LogisticRegression(random_state=1)
model.fit(df,y_train)
model.score(df_test, y_test)

为了将问题简单化，我们所创建的 Stacking 模型只有两层。第一层是建立决策树和 knn 模型，第二层是建立逻辑回归模型。实际应用中可以使用多个层次的复杂结构。

3.2 Blending

Blending 与 Stacking 类似，但是仅从训练集上划分一部分作为 holdout（验证集），没有使用 k 折验证。Holdout 集结果作为下一层的训练数据。下面是 Blending 的详细步骤解释。

1）将所有的训练数据划分为训练集和验证集。

2）在训练集上训练模型。

3）在验证集和整体测试集上进行模型测试。

4）验证集和测试结果作为元特征，进行第二层的模型训练。

5）使用该模型在整体测试集的元特征上进行模型验证。

示例代码：

首先，我们在训练集上训练两个模型：决策树和 knn，以便在验证集上作出预测。

model1 = tree.DecisionTreeClassifier()
model1.fit(x_train, y_train)
val_pred1=model1.predict(x_val)
test_pred1=model1.predict(x_test)
val_pred1=pd.DataFrame(val_pred1)
test_pred1=pd.DataFrame(test_pred1)
model2 = KNeighborsClassifier()
model2.fit(x_train,y_train)
val_pred2=model2.predict(x_val)
test_pred2=model2.predict(x_test)
val_pred2=pd.DataFrame(val_pred2)
test_pred2=pd.DataFrame(test_pred2)

然后，结合验证集的元特征，训练逻辑回归模型，在测试集上进行验证。

df_val=pd.concat([x_val, val_pred1,val_pred2],axis=1)
df_test=pd.concat([x_test, test_pred1,test_pred2],axis=1)
model = LogisticRegression() 

model.fit(df_val,y_val)
model.score(df_test,y_test)

3.3 Bagging

Bagging 背后的思想就是将多个模型（例如决策树）的结果结合得到泛化的结果。这里有一个问题：在同样的数据集上训练得到不同的模型有用吗？有很大几率这些模型将给出同样的结果，因为它们的输入都是一致的。因此，如何解决这一问题呢？常用的方法就是 Bootstrapping。

Bootstrapping 是一种采样技术，从原始数据集中有放回地采样，创建观测子集。子集的大小与原始集合的大小相同。

Bagging（Bootstrap Aggregating）技术使用这些子集（bags）来得到一个相对公平的分布（完全集）。子集的大小也可能少于原始集。

1）从原始数据集中创建多个子集，有放回地进行采样。

2）在每个子集上训练一个基本模型（弱模型）。

3）这些模型相互平行且独立。

4）最后的预测结果由所有模型共同决定。

3.4 Boosting

在我们进一步讨论之前，还有一个问题：如果一个数据点被第一个模型预测错误，那么下一个模型（可能是所有的模型）组合预测会预测正确吗？这样的情况可以通过 boosting 来处理。

Boosting 是一个循序渐进的过程，其中每一个后续模型都试图纠正前一个模型的错误。后一个模型依赖于先前的模型。下面让我们来了解 Boosting 的工作方式。

1）从原始数据集中创建一个子集。

2）起始状态，所有数据点都赋予相同的权重。

3）在这个子集上训练一个基本模型。

4）使用该模型在整个数据集上进行预测。

5）根据实际值和预测值计算误差。

6）对预测错误的数据点给予更高的权重（如上图中预测错误的蓝色的“+”将赋予更大的权重）。

7）在此数据集上训练一个新的模型并预测（该模型试图纠正上一个模型中的错误点）。

8）类似地创建多个模型，每个模型校正前一个模型的错误。

9）最终的模型（强学习器）是所有模型（弱学习器）的加权平均。

因此，Boosting 算法结合了一些弱学习器，形成一个强大的学习器。单个模型在整个数据集上表现不好，但是它们在部分数据集上可能表现得很好。因此，每个模型实际上提升了集合的性能。

4. 基于 Bagging 和 Boosting 的算法

Bagging 和 Boosting 是机器学习中最常用的两种技术。在这一节中，我们将详细地研究它们。以下是我们将重点研究的算法：

Bagging 算法：

Bagging 元估计
随机森林

Boosting 算法：

AdaBoost
GBM
XGBM
Light
GBM
CatBoost

或者在本节中讨论的所有算法，我们将遵循这个过程：

算法介绍
示例代码
参数

这篇文章中，我将讨论贷款预测问题。您可以从这里下载数据集：

https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/

请注意，对于每个算法，一些代码（读取数据、分割训练集、测试集等）是相同的。为了避免重复，我已经在下面写下这些相同的代码，之后只会深入讨论算法的核心代码。

#importing important packages
import pandas as pd
import numpy as np
#reading the dataset
df=pd.read_csv("/home/user/Desktop/train.csv")
#filling missing values
df['Gender'].fillna('Male', inplace=True)

类似地，关于数据填充、缺失值、异常值的处理，本文不做具体介绍。可参阅这篇文章了解相关内容：

https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-sas-using-python-numpy-scipy-matplotlib-pandas/

#split dataset into train and test
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.3, random_state=0)
x_train=train.drop('Loan_Status',axis=1)
y_train=train['Loan_Status']
x_test=test.drop('Loan_Status',axis=1)
y_test=test['Loan_Status']
#create dummies
x_train=pd.get_dummies(x_train)
x_test=pd.get_dummies(x_test)

接下来，让我们开始 Bagging 和 Boosting 算法吧！

4.1 Bagging 元估计

Bagging 元估计是一种集成算法，可用于分类（BaggingClassifier）和回归（BaggingRegressor）问题。它遵循典型的 Bagging 技术进行预测。下面是 Bagging 元估计算法的步骤：

1）从原始数据集中创建随机子集（Bootstrapping）。

2）子集包含所有特征。

3）用户指定的基本估计器在这些子集上进行训练。

4）每个模型的预测结合形成最终的结果。

代码：

from sklearn.ensemble import BaggingClassifier
from sklearn import tree
model = BaggingClassifier(tree.DecisionTreeClassifier(random_state=1))
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.75135135135135134

对于回归问题：

from sklearn.ensemble import BaggingRegressor
model = BaggingRegressor(tree.DecisionTreeRegressor(random_state=1))
model.fit(x_train, y_train)
model.score(x_test,y_test)

参数：

base_estimator:
它定义了基本的学习器，缺失时默认使用决策树。
n_estimators:
它定义基本学习器的数量。学习器数量需要选择合适的值，太大影响训练速度，太小影响训练精度。
max_samples:
每个子集最大样本数量。
max_features:
每个子集最大特征数量。
n_jobs:
并行运行的任务数量。将该值设置为与系统中的内核相等。如果设置为 -1，任务数量等于内核数。
random_state:
它指定了随机划分的方法。当两个模型的随机状态值相同时，它们的随机选择相同。比较不同的模型时，这个参数是有用的。

4.2 随机森林

随机森林遵循 Bagging 技术的另一种集成机器学习算法。它是 Bagging 估计算法的一个扩展。随机森林中的基本学习器是决策树。与 Bagging 元估计不同，随机森林随机选择一组特征，这些特征用于在决策树的每个节点处决定最佳分割。

随机森林算法的详细步骤如下：

1）从原始数据集中创建随机子集（Bootstrapping）。

2）在决策树中的每个节点，使用随机特征来决定最佳分割。

3）在每个子集上训练一个决策树模型。

4）最后的结果是对所有决策树的预测计算平均值。

注：随机森林中的决策树可以建立在数据和特征的子集上。特别地，sklearn 中的随机森林模型将所有特征用于决策树，并且随机选择特征子集用于在每个节点处分割。

总之，随机森林随机选择数据点和特征，并建立多个树木（森林）。

代码：

from sklearn.ensemble import RandomForestClassifier
model= RandomForestClassifier(random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.77297297297297296

你可以使用 model.feature_importances_ 来查看特征的重要性。

for i, j in sorted(zip(x_train.columns, model.feature_importances_)):
 print(i, j)

结果如下：

ApplicantIncome 0.180924483743 CoapplicantIncome 0.135979758733 Credit_History 0.186436670523. . . Property_Area_Urban 0.0167025290557 Self_Employed_No 0.0165385567137 Self_Employed_Yes 0.0134763695267

回归问题的示例代码：

from sklearn.ensemble import RandomForestRegressor
model= RandomForestRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

参数：

n_estimators:
它定义了在随机森林中创建的决策树的数量。一般来说，较多的决策树使预测更强、更稳定，但是过多会导致更长的训练时间。
criterion:
它定义了用于分裂的函数。该函数测量每个特征的分割质量，并选择最佳分割。
max_features :
它定义了每个决策树中分割所允许的最大特征数。增加其值通常会提高性能，但是过高会降低每颗树的多样性。
max_depth:
随机森林具有多个决策树。此参数定义树的最大深度。
min_samples_split:
定义叶节点分裂所需的最小样本数。如果样本数量小于改值，则节点不被拆分。
min_samples_leaf:
定义在叶节点上需要的最小样本数。较小的值使得模型更容易捕获训练数据中的噪声。
max_leaf_nodes:
此参数指定每个树的最大叶节点数。当叶节点的数量等于该值时，停止分裂。
n_jobs:
这指示并行运行的任务数量。如果您希望它在系统中的所有内核上运行，则将值设置为 -1。
random_state:
此参数用于定义随机选择。比较不同的模型时，这个参数是有用的。

4.3 AdaBoost

自适应 Boosting（AdaBoost）是最简单的 Boosting 算法之一。通常，决策树用于建模。顺序创建多个模型，每个模型校正前一个模型的错误。AdaBoost 为上一个模型中预测错误的数据点分配更大的权重，在此模型工作以便能够正确地预测。

下面是 AdaBoost 算法的步骤：

1）最初，对数据集中的所有数据点赋予相同的权重。

2）在数据子集上建立模型。

3）使用该模型，对整个数据集进行预测。

4）通过比较预测值和实际值来计算误差。

5）在创建下一个模型时，对预测不正确的数据点给出更高的权重。

6）可以使用误差值确定权重。例如，误差大的赋予更大的权重。

7）重复这个过程直到误差函数不改变，或者达到学习器的最大数量。

代码：

from sklearn.ensemble import AdaBoostClassifier
model = AdaBoostClassifier(random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.81081081081081086

回归问题的示例代码：

from sklearn.ensemble import AdaBoostRegressor
model = AdaBoostRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

参数：

base_estimator:
它有助于指定基本估计器的类型，也就是说，被用作基础学习器的机器学习算法。
n_estimators:
它定义了基本学习器的数量。默认值为10，但应设置更大的值以获得更好的性能。
learning_rate:
该参数控制最终组合中学习的贡献率。learning_rate 和 n_estimators 之间需要权衡。
max_depth:
定义单个估计器的最大深度。调整此参数以获得最佳性能。
n_jobs:
指定允许使用的处理器的数量。设置为 -1 时允许使用所有的处理器。
random_state:
它指定了随机划分的方法。如果给定相同的参数和训练数据，相同的 random_state 值总会产生相同的结果。

4.4 Gradient Boosting (GBM)

梯度提升（GBM）是另一种集成机器学习算法，它同时适用于回归和分类问题。GBM 使用提升技术，结合一些弱学习器形成一个强大的学习器。回归树作为基础学习器，每个后续的树是建立在由前一棵树计算的误差上的。

我们将使用一个简单的例子来理解 GBM 算法。使用以下数据来预测一组人的年龄：

1）平均年龄被假定为在数据集中的所有观察值的预测值。

2）使用该平均预测值和实际年龄值计算误差。

3）使用上面计算的误差作为目标变量创建树模型。我们的目标是找到最佳的分割，以尽量减少误差。

4）该模型的预测结果与 predicion1 相结合。

5）上面计算的值就是新的预测值。

6）利用该预测值和实际值计算新的误差。

7）重复步骤2到6直到达到最大迭代次数（或者误差函数不改变）。

代码：

from sklearn.ensemble import GradientBoostingClassifier
model= GradientBoostingClassifier(learning_rate=0.01,random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.81621621621621621

回归问题的示例代码：

from sklearn.ensemble import GradientBoostingRegressor
model= GradientBoostingRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

参数：

min_samples_split:
定义在节点中用于分裂的样本（或观测）的最小数目，用于控制过拟合。更高的值可以阻止模型对树选择的特定样本具有高度特异性的关系。
min_samples_leaf:

定义终端或叶节点所需的最少样本。一般来说，对于不平衡的类问题，应该选择较小的值，因为少数类居多的区域将会比较小。
min_weight_fraction_leaf:
类似于 min_samples_leaf，但定义为占所有样本点的分数大小，而不是整数。
max_depth:
树的最大深度。用于控制过拟合，因为更高的深度可能使得模型学习特定于某些样本之间的关系。应该使用 CV 调试选择最佳深度。
max_leaf_nodes:
树中的终端节点或叶子的最大数目。可以用 max_depth 定义。由于创建二叉树，N 的深度会产生最多 2 的 N 次方的叶子。如果定义了这一参数，GBM 可以忽略 max_depth。
max_features:
在寻找最佳分割时要考虑的特征数量，一般是随机选择的。作为一个经验法则，取特征总数平方根数量的特征效果不错，但是我们一般选择总特征数的 30-40%。较高的值可能导致过拟合，但一般视情况而定。

4.5 XGBoost

XGBoost（extreme Gradient Boosting）是一种先进的梯度提升算法的实现。XGBoost 已被证明是一种高效的 ML 算法，广泛应用于机器学习竞赛中。XGBoost 具有较高的预测能力，比其他梯度提升技术速度快 10 倍。它还包括各种正则化技术减少过拟合来提高整体性能。因此，它也被称为“regularized boosting”技术。

让我们看看 XGBoost 是如何比其他技术更好的：

1）正则化

标准 GBM 没有像 XGBoost 那样的正则化。因此 XGBoost 有助于减少过拟合。

2）并行处理

XGBoost 实现并行处理，并且比 GBM 更快。XGBoost 还支持在 Hadoop 上实现。

3）高灵活性

XGBoost 允许用户自定义优化目标和评价标准，为模型添加一个新的维度。

4）

处理缺失值

XGBoost 有一个内置功能来处理缺失值。

5）树修剪

XGBoost 进行分割到最大深度后，然后开始由下到上修剪树，移除没有正增益的分割。

6）内建交叉验证

XGBoost 允许用户在提升过程的每次迭代中运行交叉验证，因此很容易在一次运行中获得最佳提升迭代次数。

代码：

由于 XGBoost 可以处理缺失值，所以不必在预处理中对缺失值进行填充。你可以跳过上述代码中缺失值的填补步骤。按照其余的步骤进行：

import xgboost as xgb
model=xgb.XGBClassifier(random_state=1,learning_rate=0.01)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.82702702702702702

回归问题的示例代码：

import xgboost as xgb
model=xgb.XGBRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

参数：

nthread:
用于并行处理和系统中的允许使用的内核数量。如果希望在所有内核上运行，请不要输入此值，该算法将自动检测。
eta:
类似于 GBM 中的学习速率。通过缩小每个步骤的权重使模型更加健壮。
min_child_weight:
定义子节点样本点所需的最小加权和。用于控制过拟合。更高的值可以阻止模型对树选择的特定样本具有高度特异性的关系。
max_depth:
定义最大深度。更高的深度可能使得模型学习特定于某些样本之间的关系。
max_leaf_nodes:
树中的终端节点或叶子的最大数目。可以用 max_depth 定义。由于创建二叉树，N 的深度会产生最多 2 的 N 次方的叶子。如果定义了这一参数，GBM 可以忽略 max_depth。
gamma:
只有当分裂节点能减小损失函数一定值的时候，才分裂一个节点。参数 gamma 指定了分裂所需的损失函数减少的最小值。使得算法保守，gamma 可以根据损失函数而变化，并且应该调试。
subsample:
与 GBM 的 subsample 相同。表示每个树随机采样的数据点的分数。较低的值使算法更保守，并防止过拟合，但值太小可能导致欠拟合。
colsample_bytree:
它与 GBM 中的 max_features 特征相似。表示要为每个树随机抽样的列的分数。

4.6 LightGBM

在讨论 LightGBM 如何工作之前，让我们先了解为什么需要这个算法。我们已经有这么多 Boosting 算法了（如上面介绍的），当数据集非常大时，Light GBM 则优于其它所有的算法。与其他算法相比，Light GBM 在巨大的数据集上运行所消耗的时间更少。

LightGBM 是一个梯度增强框架，它使用基于树的算法，并遵循 leaf-wise 方式，而其他算法以 level-wise 方式工作。下面的图片将帮助你更好地理解差异。

level-wise 在数据量少的时候可能会导致过拟合，但是可以通过使用参数 max_depth 可以避免这种情况发生。你可以阅读下面的文章了解更多 Light GBM 及其与 XGB 的比较：

https://www.analyticsvidhya.com/blog/2017/06/which-algorithm-takes-the-crown-light-gbm-vs-xgboost/

代码：

import lightgbm as lgb 

train_data=lgb.Dataset(x_train,label=y_train)
#define parameters
params = {'learning_rate':0.001}
model= lgb.train(params, train_data, 100) 
y_pred=model.predict(x_test)
for i in range(0,185):
 if y_pred[i]>=0.5: 
 y_pred[i]=1
 else: 
 y_pred[i]=0
0.81621621621621621

回归问题的示例代码：

import lightgbm as lgb
train_data=lgb.Dataset(x_train,label=y_train)
params = {'learning_rate':0.001}
model= lgb.train(params, train_data, 100)
from sklearn.metrics import mean_squared_error
rmse=mean_squared_error(y_pred,y_test)**0.5

参数：

num_iterations:
它定义要执行的 boosting 迭代数。
num_leaves:
此参数用于设置树中要形成的叶子的数量。对于 Light GBM，由于分裂发生在 level-wise 方向而不是 depth-wise 方向，所以num_leaft必须小于 2 的 max_depth 次方，否则可能导致过拟合。

min_data_in_leaf:
该值过小可能导致过度拟合。它也是处理过拟合的最重要的参数之一。
max_depth:
定义树可以生长的最大深度或高度。这个参数过大会导致过拟合。
bagging_fraction:
它用于指定每次迭代要使用的数据比例。这个参数通常用于加速训练。
max_bin:
定义特征值将被插入的容器的最大数目。较小的 max_bin 值可以节省大量时间，因为它将特征值存储到离散的容器中，计算代价小。

4.7 CatBoost

处理分类变量是一个乏味的过程，尤其有大量这样的变量。当分类变量的标签太多（例如高度基数）时，对它们进行独热编码会指数地增加维度，这让数据处理非常困难。

CatBoost 可以自动处理分类变量，并且不需要像其他机器学习算法那样进行额外的数据预处理。下面是一篇详细介绍 CatBoost 的文章：

https://www.analyticsvidhya.com/blog/2017/08/catboost-automated-categorical-data/

代码：

CatBoost 算法能有效地处理分类变量。因此，不需要对分类变量进行独热编码。只需加载文件，填入缺失值，就可以了。

from catboost import CatBoostClassifier
model=CatBoostClassifier()
categorical_features_indices = np.where(df.dtypes != np.float)[0]
model.fit(x_train,y_train,cat_features=([ 0, 1, 2, 3, 4, 10]),eval_set=(x_test, y_test))
model.score(x_test,y_test)
0.80540540540540539

回归问题的示例代码：

from catboost import CatBoostRegressor
model=CatBoostRegressor()
categorical_features_indices = np.where(df.dtypes != np.float)[0]
model.fit(x_train,y_train,cat_features=([ 0, 1, 2, 3, 4, 10]),eval_set=(x_test, y_test))
model.score(x_test,y_test)

参数：

loss_function:
定义用于训练的指标。
iterations:
可以生成的树的最大数量。最终树的数量可以小于或等于这个数。
learning_rate:
定义学习率，用于梯度下降优化中。
border_count:
它指定了数值特征的分裂数，类似于参数 max_bin。
depth:
定义树的深度。
random_seed:
这个参数类似于我们先前看到的参数 random_state，它是一个整数，定义用于训练的随机种子。

结语

集合建模可以指数地提高模型的性能！在本文中，我们介绍了各种集成学习技术，并了解了这些技术在机器学习算法中的应用。此外，我们实现了我们的贷款预测数据集的算法。

如果觉得文章还可以的话，烦请关注、点赞、转发，谢谢！

分享到:

閱讀更多 機器學習與數據挖掘 的文章

關鍵字: Python 读书编程语言

本田CBR300R对比铃木GSX250R，何去何从，听我一言

这应该是我从12年第六辆摩托车了，最近因为银刃250日常骑行动力表现实在不尽如人意，而我因为没有四轮驾照，需要每天骑行上下班，所以就产生了再换一辆动力表现不错的小车，于是就开始了琢磨换车。

拿下二手2016款川崎ER6N，作为Z650的前身，此车性价比真高

2016款川崎ER6N是川崎Z650的前身，本人非常喜欢川崎的造型，最其品质也是很放心。无奈的是钱包不够鼓，只能选购了一辆车友换代的车，川崎ER6N，这车在上任车主手里保养的还是很不错的。

手把手教你给自己的摩托换机油，爱车怎么能不会保养它

平时的更是爱护有加，说到保养，摩托车就比较简单了，而且自己来的话，也放心，更能体会其中的乐趣。此次更换机油，包括更换机油滤芯，有少数车友从来只换机油不换滤芯，甚至不知道要换滤芯，这是极其伤车的行为。

十五万的大绵羊，YAMAHA的T-MAX530入手，物有所值

喜欢上T妈妈还是07年的事情，当时坐骑是yamaha majesty125，珠峰欧洲霸王，第一次在雅马哈巡展看到T妈妈后就欲罢不能了，超级喜欢，可是十几万的价格在当时无疑是天价，根本没人会买。

豪爵街车DR300终版亮相：配置、动力全曝光，看看值不值34580元？

大概从两年前开始，豪爵旗下就曝光了一款中央级别的运动街车DR300，但是随着时间的推移，这款车型一直都没有亮相，让很多车友都感到遗憾。

售价16.98-24.98万 2019款福特翼虎上市

日前，长安福特正式宣布2019款福特翼虎上市。新车相比老款增加了全新的互联网汽车智能系统，售价区间为16.98-24.98万元。

运动性能一目了然全新起亚K5 GT谍照曝光搭载2.5T发动机

【佰咖汽车·进口新车资讯】近日，有海外媒体曝光了一组全新起亚K5GT的路试谍照，外观方面与全新K5相比差距不大，内饰融入更多运动化元素，动力上采用更为强劲的2.5T发动机，新车内外运动性能一目了然。

宝马3系也拿它没辙！奔驰狂降到25.18万

提到豪华品牌的入门级车型，相信很多人都会首先想到宝马3系、奥迪A4L以及奔驰C级这3款车吧，没错，师哥脑海中首先想到的也是这些车型。

辣评：史上“最冷”9月自主SUV谁能挺过寒冬？

今年一直萎靡的SUV市场再度跳水，同比两位数下滑。据乘联会数据，9月SUV批发销量87.7万辆，同比下滑10.2%。

比亚迪宋MAX长测外观时尚

1外观介绍去年比亚迪宋MAX刚上市的时候，我觉得这真是很符合我这种二胎家庭需求的车型。如果它能早一年上市，说不定我会成为第一批车主。

一降再降的日系车，与丰田C-HR同级，百公里油耗5.9L，已不足8万

通常日系车的价格比较坚挺的，比如丰田凯美瑞在中型轿车领域就很强势，所以价格一直没有多少优惠，而在小型SUV中，丰田C-HR自从上市以来的优惠幅度就很有限，基本上只有几千元，所以虽然它很受欢迎，但是预算有限的人，就只能关注别的车型了。

传感器和5G通信技术开发智能化重型卡车

目前，三一集团正与中国移动合作，基于5G网络在三一重卡置入5G模块、传感器、激光雷达，实现重卡的智能驾驶，让重卡车队实现软连接、无人驾驶编队，这也意味着，以后一个重卡车队，只要一个司机就可以驾驶好几辆重卡上路。

@温江人走这儿也可以上成温邛高速咯！

温江便捷高效畅通之城建设再添喜讯新增一条进入成名高速匝道图@黄艳@温江交通运输局消息为提升通行效率缓解江宁南路、天乡路调头车辆拥堵情况将在鱼凫路开设一条新的高速入口匝道就是红箭头指的地方图@黄艳成名高速温江北入口优化改造工程项目简易单向匝道，限高2.5米限速20KM/h限制货车、

对话比亚迪叶庭文关于比亚迪汉你还不知道的事

在聊比亚迪今年推出的重磅车型——比亚迪汉之前，叶总对于疫情之下的2月份能取得这一成绩是非常意外，甚至曾一度以为“是数据出了错”。

从0到1再到∞ 得数据者得自动驾驶天下

特斯拉曾在 2018 年 11 月公布过一个数据：全球所有的特斯拉车主在自动驾驶 Autopilot 启动下驾驶的总里程数已经突破 10 亿英里。

广新Aion V渲染图曝光逸动E-Life谍照长安发布 2019年业绩

001/ NEDC 续航里程 600 km 广汽新能源 Aion V 渲染图曝光据国外媒体报道，特斯拉在去年 11 月份推出了电动皮卡 Cybertruck ，预计 2021 年年底开始生产。

蠢事做绝？于汉超当街涂改车牌原因揭晓！恒大俱乐部人士首度发声

在于汉超因为当街涂改车牌，而被恒大俱乐部开除并且解约之后，不少网友至今仍不解，已经33岁作为成年人的他，为何会知在街上公然知法犯法？众所周知，于汉超是大连人，即便在恒大已经效力6年，他也一直开车那辆大连牌照的奔驰大G。

80年代的A组宝马635 FIA，宝马迷看过来！

在20世纪80年代的芬兰房车锦标赛上，这款1983年的宝马635FIA在A组的领奖台上占据了统治地位。

1967年推出的保时捷911 Targa，我赌你肯定没看过！

从1963年诞生以来，共经历了七代车型，因其独特的风格与极佳的耐用性享誉世界。保时捷911系列是整个保时捷乃至于整个德国整个世界最传奇的车型之一，同时也是中后置引擎跑车的代表作之保时捷911是最具标志性的交通工具之一。

留着博世血统德国蓝宝电器，坚持创新和品质的核心精神美誉全球！

有着近百年历史的“世纪品牌”德国蓝宝，以创新和品质为基础，它的良好声誉是经得住时间的考验的。Blaupunkt从1933年成为德国Bosch博世集团旗下全资子公司，自2009年开始成为独立运维的德国品牌。

奔驰没违停，没挡路，却被锁上1百多把防盗锁！网友：太仁慈了

奔驰没违停，没挡路，却被锁上1百多把防盗锁！网友：太仁慈了！生活中，大家可能都见过停放在街边的电动车、摩托车上面锁着一把防盗锁，至于原因，顾名思义就是为了防盗。而汽车由于自身防盗系统完善，没有锁防盗锁的必要，所以汽车上锁防盗锁的情况基本没有。

“不用刹车，直接撞！”4S店带客户体验助刹车，结果真撞上了

4s店的销售带客户试乘车，没想到用前车人的性命当障碍物，说“不用刹，直接撞”，在这之后就发生了严重的交通事故。

经典培训PPT｜通用汽车是如何稳步前进－持续改进！

没有一个企业是没有问题的，关键是如何看待问题和解决问题。很多企业，将问题解决之后就停止了，没有进行问题的原因分析，制定短期或长期的对策，彻底消除这些问题的根本原因。

特斯拉进驻天猫不卖车，1200元的车钥匙卖得最好

1200元的车钥匙卖得最多南都记者登录天猫看到，暂时拥有2万粉丝的特斯拉天猫旗舰店，并不会直接售卖车辆，目前售卖的主要还是汽车配件以及周边，例如车钥匙、充电桩、脚垫、车载充电套件等。

国产降价冠军！打五折都没人买？奔驰旗舰SUV换个标就没人要了？

北京品牌是个奇葩的存在，BJ40-Jeep牧马人、BJ80-奔驰GClass，说是逆向开发也好，说是抄袭模仿也罢，不可否认的是它两都蹭上了原型车的热点，加上产品本身的产品力尚可并非众泰那类样子货，所以BJ40还能有两千台左右的月销量。

第50万辆整车下线成都造沃尔沃成功出口54个国家和地区

昨日，沃尔沃汽车成都工厂第50万辆整车下线，据悉这是一辆沃尔沃XC60，已被欧洲车主预订，将搭乘中欧班列运抵欧洲并交付到车主手中。

在咸阳汽车胎压检测仪器报警器真的有用？轮胎胎压表开箱安装视频

如今我们都知道随着汽车的普及，在我们驾驶汽车中，安全问题越来越重要。下面让疯子带你来看看：1.胎压胎温实时精准检测2.高压、底压、漏气、高温报警3。

3月销量只有5千出头，日产奇骏开始承压了！

再来看看日产和马自达，这“哥俩”就有些相形见绌了，日产本来还有一个奇骏可以挑大梁，不过进入2020年后销量情况迅速下滑，刚刚过去的3月份只有5千出头的成绩，可要知道日产奇骏去年销量可是能跟哈弗H6相比较的，挤进前五不在话下，现在开始承压了，而马自达CX-4还是一如既往的“稳定”。

要想人记得住，就得有特点，汽车也不例外！

这年头想要给人留下印象，不管是好的还是坏的，能让人记住你那你可能就算是成功了。现在的车企想办法在车子外观上换着花样的出新招，就是为了得到消费者的注意，也有些车企开始采用家族的前脸，不管是什么型号，一看车头就知道是什么车，全系一样的脸，你说霸道不霸道。

看脸的世界，高颜值的SUV代表

现在人们对颜值的要求是越来越高，职场上，学历相当、工作能力差不多的人在一起，长得好看的脱颖而出的机会会大些。

上市不足半年，降价50万，这样一款国产豪华你心动吗？

同样是“腰斩”的价格，但这样的车就不一定就会热销，原因很简单，就是这种50万级以上的豪华车，市场注定是小众的，并且今天要说的这款车还是一款国产车，即便它降价50万，但消费者依旧会左右权衡一下，这款车到底值不值得为之付出50万！

疫情过后，你还准备买车吗？

前言因为新冠疫情，这次长达两个月余的春节假期远远超出了很多人的预期，还是让人猝不及防。贪图安逸是人的天性，没钱是客观现实，因为这年头，就算你想成为废物，也要有足够的经济能力支撑你的颓废，否则连堕落都会变成一种奢侈。

国产车三巨头3月份销量出炉，长安汽车一马当先，差距已经拉开！

进入2020年之后，汽车行业的两极分化进一步凸显，头部车企的竞争也进入白热化阶段，随着疫情过去，汽车行业渐渐转好，近日国产车三巨头3月份的销量也已经出炉，那么它们在3月份的销量表现又如何呢？

25.99万元起售，全新开拓者上市！是迎难而上还是底气十足？

近段时间凡是说起7座中型SUV，似乎都离不开二胎、离不开二胎政策。但是，在汽车市场正迎来的年轻化趋势下，中型SUV却成为了车市近两年市场份额增长最快的细分市场，这点，其实足以让我们打破7座中型SUV乃至7座SUV的原有市场定位和固有印象了。

2020品牌影响力得分，前十被合资进口占据，日产竟排在了最后？

J.D.Power发布了2020中国新车购买意向研究结果，这项研究里面还包括了品牌影响力得分的排名。

选第一辆车魅力十足的君越

前前后后选了一年多的车型，于今终于买了，纠结了一年多的心病也算是好了！最早想买君威，后来陆续看了雅阁、天籁、凯美瑞、帕萨特、迈腾。

平安"金融+生态"模式下的优等生平安好车主信用卡正式上线

1月8日，中国平安保险（集团）股份有限公司（下称"平安集团"）旗下的平安银行与平安产险联合，在行业内率先推出"集大成"的车主服务方案——平安好车主信用卡，该卡不仅自带"平安行"保障，还覆盖了加油、洗车、代驾、接送机等车主服务，为车主提供一站式、全生命周期的用车服务；此外，平安信用

网约车的春天来了：“分时经营”上新规，兼职跑只要人证！

其实这种类似模式，枣庄不是先例，早在2019年6月份，大庆市出台政策私家车不需要办理网约车运输证，不需改变车辆性质，只需要备案登记，就能从事网约车运营。差异化管理，这对于那些兼职网约车司机来说，无疑是一大利好，如果新规通过，春天真正来临。

比亚迪新型电池能否带动新市场？

强强联手首发搭载中大型高端轿车比亚迪汉据王传福先生现场透露，刀片电池只在比亚迪汉纯电车型搭载应用，其他车型暂无规划。

大众品牌在售的唯一敞篷车，大众T-ROC敞篷版实拍图发布

提到大众品牌的敞篷车，大家首先想到大众EOS或是甲壳虫敞篷版，但这两款车型其实都早已停产，如今大众品牌唯一在售的敞篷车其实是一辆SUV车型，它就是刚刚在欧洲推出的踢大众T-ROC敞篷版。

江西国际汽车会展中心2020首展开启，中部汽车房车文化节重磅发布

江西省委省政府在4月18日正式出台了《关于促进汽车消费的若干措施》，积极鼓励和支持当地汽车行业协会、经销商等结合实际开展各类汽车展览展销和促进活动。

为什么老司机都爱这样踩刹车？修车师傅：不光能省油，还很安全

为什么老司机都爱这样踩刹车?修车师傅:不光能省油，还很安全。那最后一个就是下长坡的时候踩刹车了，这是一个误区，很多新手在下长坡路段的时候都会有习惯一直踩着刹车，并且控制着车速，但是这样会引起刹车系统摩擦时间过长，可能会造成其他事故。

吉利和奇瑞谁的质量更胜一筹？修车工将车门拆开后，差距一目了然

现在的国产车那是发展是突飞猛进了，就是因为发展的很快也是让给合资车带来很大的麻烦和压力，即使很多的合资车在选择降价的应对，但是也是白费力气并没有给国产车增加压力还是在很快的发展，在质量和口碑上面也是不断的上升的国产车，不管是在市场上还是合资车带来的威胁都是无用的。

女车主开百万豪车，上车的方式也是与众不同的

我们开车的时候总会出现点小问题，就像一些女司机开车是让人十分的头大，开车都开的让人头大，停车的时候真的是绝了，虽然是停好了，但是人却难出来了。

中国低端车，来到朝鲜后摇身一变成为豪车，满大街的“豪横”味道

中国低端车，来到朝鲜后摇身一变成为豪车，满大街的“豪横”味道现在是不得不赞美我国的经济发展的很快，在各行各业也是有着很多的进步，就像我国的车都已经出口在海外了，也是在国外而已是一个进口的车，和别的进口车相比，进口车是有着很高的税费和运输的费用，才会有很多的车的车本自然的增加，那就

增长75.95%！这份温馨的出行提醒你请查收

知己知彼，才能“机智出行”so，希望小编们精心整理的这一组数据指南能够帮助小伙伴们提前规划行程、规避拥堵据统计全省高速公路免收通行费加之复工复产全面推进我省高速公路流量较去年同期有明显增长尤其是货车流量增幅较大从3月13日到4月12日全省高速公路总流量为3790.36万辆与去年同

陕西高速公路4月15日起恢复收费？官方回应

最近，一张抬头为陕西省交通建设集团公司、标题为《关于做好运营单位收费系统调试等有关事项的通知》的图片在网络流传。不少车主好奇，这是否意味着从今天起陕西省高速公路要恢复收费了？

一电观察｜长续航车型不断上新，但续航焦虑并未解决

理想汽车的创始人李想在前段时间“雪球路演”的活动中说道，特斯拉已经开始发挥其“鲶鱼”效应，促进国内市场发展，倒逼国内厂商做好产品，服务好C 端用户。

特斯拉，请别辜负喜欢你的“韭菜”丨壹观察

“我来了，你准备好了吗？”4月10日，国产特斯拉Model 3的长续航版与高性能版开售。一边，车迷用行动诠释着“真香”定律——Tesmanian网站显示，一分钟就有10个新车订单，在24小时里订单量就突破了2万辆。

这车只要持续正常发挥，中型车霸主地位将无可动摇

这车只要持续正常发挥，中型车霸主地位将无可动摇当我们说到B级车的时候相信许多的网友们最先想到的应该就是帕萨特以及迈腾了。

一份完备的集成学习手册！（附Python代码）

引言：

目录：

1. 集成学习简介

2. 基本的集成技术

3. 高级集成技术

结语

相關文章:

一份完备的集成学习手册！（附Python代码）

引言：

目录：

1. 集成学习简介

2. 基本的集成技术

3. 高级集成技术

结语

相關文章:

本田CBR300R对比铃木GSX250R，何去何从，听我一言

拿下二手2016款川崎ER6N，作为Z650的前身，此车性价比真高

手把手教你给自己的摩托换机油，爱车怎么能不会保养它

十五万的大绵羊，YAMAHA的T-MAX530入手，物有所值

豪爵街车DR300终版亮相：配置、动力全曝光，看看值不值34580元？

售价16.98-24.98万 2019款福特翼虎上市

运动性能一目了然 全新起亚K5 GT谍照曝光 搭载2.5T发动机

宝马3系也拿它没辙！奔驰狂降到25.18万

辣评：史上“最冷”9月 自主SUV谁能挺过寒冬？

比亚迪宋MAX长测 外观时尚

一降再降的日系车，与丰田C-HR同级，百公里油耗5.9L，已不足8万

传感器和5G通信技术开发智能化重型卡车

@温江人 走这儿也可以上成温邛高速咯！

对话比亚迪叶庭文 关于比亚迪汉你还不知道的事

从0到1再到∞ 得数据者 得自动驾驶天下

广新Aion V渲染图曝光 逸动E-Life谍照 长安发布 2019年业绩

蠢事做绝？于汉超当街涂改车牌原因揭晓！恒大俱乐部人士首度发声

80年代的A组宝马635 FIA，宝马迷看过来！

1967年推出的保时捷911 Targa，我赌你肯定没看过！

留着博世血统德国蓝宝电器，坚持创新和品质的核心精神美誉全球！

奔驰没违停，没挡路，却被锁上1百多把防盗锁！网友：太仁慈了

“不用刹车，直接撞！”4S店带客户体验助刹车，结果真撞上了

经典培训PPT｜通用汽车是如何稳步前进－持续改进！

特斯拉进驻天猫不卖车，1200元的车钥匙卖得最好

国产降价冠军！打五折都没人买？奔驰旗舰SUV换个标就没人要了？

第50万辆整车下线 成都造沃尔沃成功出口54个国家和地区

在咸阳汽车胎压检测仪器报警器真的有用？轮胎胎压表开箱安装视频

3月销量只有5千出头，日产奇骏开始承压了！

要想人记得住，就得有特点，汽车也不例外！

看脸的世界，高颜值的SUV代表

上市不足半年，降价50万，这样一款国产豪华你心动吗？

疫情过后，你还准备买车吗？

国产车三巨头3月份销量出炉，长安汽车一马当先，差距已经拉开！

25.99万元起售，全新开拓者上市！是迎难而上还是底气十足？

2020品牌影响力得分，前十被合资进口占据，日产竟排在了最后？

选第一辆车 魅力十足的君越

平安"金融+生态"模式下的优等生 平安好车主信用卡正式上线

网约车的春天来了：“分时经营”上新规，兼职跑只要人证！

比亚迪新型电池能否带动新市场？

大众品牌在售的唯一敞篷车，大众T-ROC敞篷版实拍图发布

江西国际汽车会展中心2020首展开启，中部汽车房车文化节重磅发布

为什么老司机都爱这样踩刹车？修车师傅：不光能省油，还很安全

吉利和奇瑞谁的质量更胜一筹？修车工将车门拆开后，差距一目了然

女车主开百万豪车，上车的方式也是与众不同的

中国低端车，来到朝鲜后摇身一变成为豪车，满大街的“豪横”味道

增长75.95%！这份温馨的出行提醒你请查收

陕西高速公路4月15日起恢复收费？官方回应

一电观察｜长续航车型不断上新，但续航焦虑并未解决

特斯拉，请别辜负喜欢你的“韭菜”丨壹观察

这车只要持续正常发挥，中型车霸主地位将无可动摇

王者荣耀国服在榜大神“奇葩出装”这样做误导小朋友，如何评价？

新手快速上手游戏详细攻略？

有人说王者荣耀连胜之后的连跪是系统“安排”，还是实力不够，你对连胜之后必定连跪怎么看？

国足最新一期大名单出炉，锋线上有三名中锋，艾克森会再一次被安排到边路位置上吗？

王者荣耀出现资源损坏bug，英雄被禁用游戏不能对局，玩家直呼补偿荣耀水晶，你怎么看？

王者荣耀：假如给你50万RMB，和游戏里面的一个女英雄生活在荒岛上，你会选择谁？

有什么好玩的小游戏？

头条小游戏生化战警攻略是什么？

手机上有哪些类似gta的开放游戏推荐？

《邦尼兔的奇幻星球》一个充满兔子的星球，好玩吗？

10多台电脑的游戏工作室能做什么赚钱？

什么网游好玩又可以交朋友？

什么游戏可以直接换成人民币？

王者荣耀消耗钻石赢好礼福利活动开启，玩家最多可得40皮肤碎片，为何玩家嫌官方没诚意？

QQ炫舞手游进入社区卡顿怎么办？

QQ炫舞手游社区进化大作战怎么玩好？

《王者荣耀》的演员是什么意思？

有什么好玩的手机游戏？

热门游戏《王者荣耀》所属是哪个公司？你怎么看这款游戏？

有什么游戏能在学校里玩？

传奇游戏在中国的演变过程是怎样？

仁王游戏怎么样？

运动性能一目了然全新起亚K5 GT谍照曝光搭载2.5T发动机

辣评：史上“最冷”9月自主SUV谁能挺过寒冬？

比亚迪宋MAX长测外观时尚

@温江人走这儿也可以上成温邛高速咯！

对话比亚迪叶庭文关于比亚迪汉你还不知道的事

从0到1再到∞ 得数据者得自动驾驶天下

广新Aion V渲染图曝光逸动E-Life谍照长安发布 2019年业绩

第50万辆整车下线成都造沃尔沃成功出口54个国家和地区

选第一辆车魅力十足的君越

平安"金融+生态"模式下的优等生平安好车主信用卡正式上线