怎样判断分类特征值选取是否有效( 二 )
具体的方法你去看sklearn.feature_selection的documentation就好,觉得不够详细再看源码,这样可以更加理解。
还有一类是训练模型之后输出的特征重要性排序,这个严格来说叫特征评价。
比如用的是gbdt、xgboost之类的,模型会告诉你他在训练的时候通过一些参数的配置(其实还是lasso\u0026amp;ridge惩罚降维)和树的特性把哪些特征筛掉了,xbg的话,模型可以输出cover\\gain\\weight三种指标,gain是信息增益,跟基本决策树一样的,根据经验条件概率来求和的。weight是特征权重,跟cover的区别大概在于weight是横向来看这个特征导致了几次分裂,cover是子树内纵向来看这个特征区分了多少样本,这么理解就好。
这两类方法的主要区别在于,第二类是模型的特征评价,模型,模型,模型。如果你的模型没训练好,比如参数调的不好或训测集分的渣了,那这个特征序列就会偏离真实的数据了。
推荐阅读
- 聪明人养花,这3种“花”怎样也要养一盆,每年能省不少医药费
- 垃圾■垃圾分类哪里强?南京全市成绩单亮相!
- 互联网怎样解决“家政服务上门速度慢”的问题
- 怎样看待从1月8号起,QQ钱包开始提现收费
- 银行it人怎样转型
- 汽车|冬天怎样让车内温度快速升高?座椅加热的最佳使用方式二,外循环的作用总结
- 怎样进入通信行业
- 怎样评价扶他柠檬茶的小说《云养汉》的结尾
- |打造垃圾分类管理“姑苏标准”
- 怎样成为一名合格的Python程序员?
