关于GBDT的几个不理解的地方? 建议还是去看

建议还是去看一下gbdt的wiki或者实现方法，其实仔细看过一遍之后就会很清晰了。你的问题，“树的个数就是分类的类别个数”，这是明显不对的。说明你还没有明白gbdt到底是做什么的。说到底，它的底层还是用tree去做分类或者回归，就像你以前所了解的tree一样，没什么差别，只是这里用的是回归树（可以设想，如果是做分类，其实这一棵树已经得到所有的分类结果了）；但是，为了提高精度，当使用一棵树训练完以后，我们还想在它的基础上再去把它的残差拿来做二次加工、三次加工。。。这样就有了后面的树。想要几棵树就看你自己心情了（笑）。当然这里面也就是gradient boosting的内容了。那么，通过上面的描述，你就应该很清楚了，如果是k分类问题，当一个样本输入后，理论上（每棵树可能不是都用到了所有的feature，而数据中的feature也有可能缺失，所以说理论上）它会经过你已经训练好的n棵树，并且会掉在每棵树的某一个叶子节点上。而每个叶子节点其实也都可以表示为一个k维的向量，代表这个样本在这棵树上被分到这个叶子节点上的时候，其属于每一个分类的可能性。最后，组合n课树的结果，看这个样本属于哪一类的可能性最大。看公式第6步那里：

其实gbdt除了做分类和回归，还可以做很多其他事情，这里就不展开讨论了。
■网友
树的个数就是最大迭代次数，与分类类别无关前提不成立=，= 多分类问题每棵树都是多类别分类器
实际计算的残差 = 样本i对应类别k的真实概率 - 上一轮预测的概率

■网友
1.都是回归树拟合负梯度，残差只是均方loss负梯度的特例。
2.树的个数和类别个数没有关系，多类别问题每棵树都是多类别分类器，最后ensemble

■网友
首先，GBDT所使用的基本学习器都是回归树，所以再解决分类问题时，拟合的都是类别的概率，是一个值，跟逻辑回归的思想差不多；其次，二分类问题中，类别的个数与树的个数肯定是无关的，但多分类问题中，树的个数就等于k*m，k为类别个数，m为对每个类别训练的树的个数；最后，gbdt的多分类问题使用的就是一对多的方法，所以确实只要关注训练该类别所使用的m课树的拟合值的汇总结果是否大于阈值即可。

■网友
个人感觉基于梯度就是用损失函数负梯度在当前模型的值作为残差近似值了。。还是残差的问题吧。而且累加的就是每次迭代学习到的‘弱分类器’，和分类个数木有关系诶。
■网友
我写了一篇文章，介绍了 GBDT 相关的一些算法，是我自己的学习心得，可以参考下，
火眼狻猊：GBDT、XGBoost、LightGBM 的使用及参数调优 【关于GBDT的几个不理解的地方?】

■网友
第一个问题，树的个数与分类的类别数目没有关系。第二个问题貌似是基于第一个问题的，所以这个问题得前提就不对。建议你看一下维基的解释（Gradient boosting），非常清晰，希望能对你有所帮助。
■网友
GBDT如何做分类，或者多分类，因为GBDT使用的是回归CART树，所以这个问题变成了CART回归树如何做多分类问题，CART本来有一个分类的基于Ginni系数的，但是没用ta，如何让CART回归树，用来做分类，其实如果是k分类，就相当于有K个不同的属性要建立回归，比如本来回归是要预测Age（是一个连续的值），但是如果要预测多分类，（爬行动物，两栖，哺乳）这三类的话，就会变成分别对（爬行动物（是或者不是）单独做一个CART回归树，会比较矮？也不一定，因为不一定每次二分都能够完美分开啊）

关于GBDT的几个不理解的地方?

推荐阅读

扑救：四川凉山州木里县发生森林火灾两千多人参与扑救

人生|“人若有福，一看便知”：有福气的人，往往有这3大特征，很准！

「双子座」4月下旬，财运水涨船高，3属相有贵人指路，一生衣食无忧

原创星座|喜报登门，3星座终于告别单身，11月桃花运逆袭

星巴克公司|高考都来了端午买的粽子还没发货星巴克客服：等7月中下旬

#教育部回应最有影响力学者排行榜#教育部回应最有影响力学者排行榜

【特斯拉】续航超700公里，王传福的杀手锏，特斯拉也怕三分

湘湘带你看社会|车窗被碾压起的石子砸碎该咋办？别慌！交警、保险部门建议……

淘宝店铺创建时间怎么查怎么查店铺什么时候开的

腰果银耳拌香芹

心衰症状有哪些

迷彩虎军事：车门能挡住子弹吗？老外拿退役警车做实验

国资|复牌“官宣”，博天环境与青岛西海岸国资分手，新归宿为中山市国资

绝地养鸡王|魔兽怀旧服：玩家感叹自己变了，硬生生把魔兽完成了氪金游戏！

舌尖上的创想|澳洲甲悉尼ＦＣ复赛首轮逆转对手，新城堡联队状态有待观察

外星人ufo探索网 ufo实拍外星人

如何自己学好英语英语心得

天坛圜丘坛的数字“密码”

双腿烫伤疤痕十八年只能一辈子长裤了么

直播吧|本赛季11次出场7次零封，官方：利兹联买断门将梅斯利耶