中年机器学习常见的损失函数以及何时使用它们( 二 )
本文插图
本文插图
相应的成本函数是这些绝对误差(MAE)的平均值 。 与MSE损失函数相比 , MAE损失函数对异常值具有更强的鲁棒性 。 因此 , 如果数据有很多异常值 , 可以考虑使用它 。
1. Huber损失/平滑平均绝对误差(Huber Loss / Smooth Mean Absolute Error)
Huber损失函数是MSE和MAE的组合 , 当误差较大时 , 取平均绝对误差 , 当误差变得很小时 , 取均方误差 。 转换条件由超参数(delta)控制 。
本文插图
【中年机器学习常见的损失函数以及何时使用它们】
本文插图
delta值的选择非常关键 , 因为它决定了我们将什么视为异常值 。 因此 , 与基于超参数值的MSE损失函数相比 , Huber损失函数对异常值不太敏感 。 如果数据容易出现离群值 , 可以考虑使用它 。
1. 对数余弦损失(Log-Cosh Loss)
对数余弦损失函数定义为预测误差双曲余弦的对数 。 它是回归任务中使用的另一个函数 , 比MSE损失函数平滑得多 。 它具有Huber损失函数的所有优点 , 而且它在任何地方都是两次可微的 , 不像Huber损失函数不具有可微性质 。 而一些学习算法 , 如XGBoost使用牛顿法来寻找最佳值 , 因此需要二阶导数(Hessian) 。
本文插图
本文插图
当x较小时 , log(cosh(x))约等于(x**2)/2 , 当x较大时 , 约等于abs(x)-log(2) 。 这意味着"logcosh"的工作原理与均方误差类似 , 但不会受到偶尔出现的显著错误预测的强烈影响 。
1. 分位数损失( Quantile Loss)
分位数是指一组中有一小部分样本低于该值 。 顾名思义 , 分位数回归损失函数用于预测分位数 。 对于一组预测 , 损失将是其平均值 。
本文插图
本文插图
当我们对预测一个区间而不是仅仅对点预测感兴趣时 , 分位数损失函数是十分有用的 。
推荐阅读
- 中年美国寸土寸金,为何要在纽约建立林则徐广场?原因很简单
- 中年北斗系统发言人答封面新闻:北斗定位精度最好可达1点几米
- 中年检测设备行业政策及环境
- 中年元春回府省亲为何会在夜晚进行?原来其中大有文章
- 中年北斗三号全球服务可用性达99%以上,全球范围定位精度优于10米
- 小i机器人|小i机器人对苹果提起侵权诉讼索赔人民币100亿元
- 仰卧撑运动园|中国足球却难学习曲线留洋,日本球员“组团”前往比利时“练级”
- 天气早知道|操纵“魔杖”、和AI机器人互动……科技课原来可以这么好玩
- 黄子韬和机器人吵起来了|【铁憨憨的日常】黄子韬和机器人吵起来了 幼稚鬼韬三岁无疑了
- 小i机器人对苹果提起诉讼并索赔100亿人民币
