机器学习中的类别不平衡问题
谢邀。
我遇到的场景中,9比1都不算不均衡,经常是1000:1,10000:1。
■网友
尽量的控制训练集的语料平衡,对你的训练才能减少偏向。
■网友
首先经验定义类别不平衡是超过100:1,A类如果在实际生活中偏少,也不能说明A类所含的信息价值偏低,有时候恰恰相反,比如股票的涨停和跌停是小样本,但是所含的信息价值反而很高。所以其实我们更期望对小样本进行更好的分类,所以才采用Rescaling的方法。
详细可以参考不平衡分类学习综述(陈晶 南京大学)
【机器学习中的类别不平衡问题】
推荐阅读
- 鄂温克冬季马赛-30℃极寒开赛:寒冬中的火热派对
- 大雪@大雪腌肉 适当进补 今日大雪
- |电商事业中的“闪光少年”
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- 婴儿|美国儿科学会: 1岁以下婴儿不推荐学习游泳
- 电话营销机器人哪个比较好用
- hadoop中的mapreduce链接(mapreduce chaining)怎样避免中间文件的产生
- 在美国大学学习computer science 是啥样的体验
- 经观汽车|日系车企中的“异类”?东风日产将导入e-POWER技术大干增程式混动 | 经观汽车
- 请问有哪些机器人大赛是比较权威的
