机器学习中的类别不平衡问题

谢邀。
我遇到的场景中,9比1都不算不均衡,经常是1000:1,10000:1。

■网友
尽量的控制训练集的语料平衡,对你的训练才能减少偏向。

■网友
首先经验定义类别不平衡是超过100:1,A类如果在实际生活中偏少,也不能说明A类所含的信息价值偏低,有时候恰恰相反,比如股票的涨停和跌停是小样本,但是所含的信息价值反而很高。所以其实我们更期望对小样本进行更好的分类,所以才采用Rescaling的方法。
详细可以参考不平衡分类学习综述(陈晶 南京大学)
【机器学习中的类别不平衡问题】


    推荐阅读