bagging,boosting和随机森林是应用最为广泛的三类集成学习算法。
Bagging算法定义如下,给定大小为n的数据集,算法采用Bootstrap抽样,得到m个新的训练数据集Di,每个数据集大小均为你,通过这m个样本集得到m个模型,然后通过求平均(回归问题)或者投票方法(分类问题)来选择最优的模型。
相关汉字解释: