中年机器学习常见的损失函数以及何时使用它们 |函数|损失|

每一个机器学习工程师都应该知道机器学习中这些常见的损失函数以及何时使用它们。
在数学优化和决策理论中，损失函数或成本函数将一个或多个变量的值映射为一个实数，该实数直观地表示与该事件相关的一些"成本" 。

本文插图
损失函数是机器学习算法中的一个重要部分，主要用于进行算法对特征数据集建模效果的评估，衡量算法的性能。
损失函数是每个样本预测值和真实值的差值，而成本函数是所有损失函数的平均值。但是一般两者语义没有明显的区分。损失函数直接反映了机器学习模型的预测结果。一般而言，损失函数越低，所建立的模型所提供的结果就越好。所以损失函数被用于评估模型的性能，通常人们想要损失函数最小化。
广义地说，损失函数根据应用场景可以分为两大类：分类问题和回归问题。在分类问题中，任务是预测问题所处理的所有类的各自概率。相反，在回归问题中，任务是预测一组给定的独立特征对学习算法的连续值。
假定符号如下： n/m——训练样本的数量； i——第i个训练样本； y(i)——第i个样本的真实值； y_hat(i)——第i个样本的预测值。分类问题中的损失函数
1. 二值交叉熵损失/对数损失（Binary Cross-Entropy Loss / Log Loss）
这是分类问题中最为常见的损失函数。交叉熵损失随着预测概率准确度的提高而降低，能够被用于反映分类模型（输出为0-1之间的概率）的性能。
当类别数量为2时，是二值分类问题：

本文插图
当类别数量大于2时，是多分类问题：

本文插图

本文插图
交叉熵损失公式由正则似然函数导出，但进行了对数处理。
1. 铰链损失（Hinge Loss）
用于分类问题的第二个最常见的损失函数是铰链损失函数，也是交叉熵损失函数的替代方法，主要用于支持向量机（SVM）模型评估。

本文插图

本文插图
铰链损失不仅对错误的预测做出惩罚，也对概率较低的正确预测做出惩罚。它主要用于分类标签为-1和1的支持向量机分类器。使用过程中需要确保将恶性类标签从0更改为-1 。

本文插图
回归问题中的损失函数
1. 均方误差/二次损失/L2损失（Mean Square Error / Quadratic Loss / L2 Loss）
均方误差是指真实值和预测值之间的平方差的均值。是最常用的回归问题损失函数。

本文插图

本文插图
相应的代价函数是这些平方误差（MSE）的平均值。 MSE损失函数通过平方化误差来惩罚模型的误差，这种性质使得MSE代价函数对异常值的鲁棒性降低。因此，如果数据容易出现许多异常值，则不应使用它。
1. 平均绝对误差/L1损失（Mean Absolute Error / L1 Loss）
评价绝对误差定义为实际值与预测值之间绝对差值的平均值。它是第二个最常用的回归损失函数。它测量一组预测中误差的平均大小，而不考虑它们的方向。

中年机器学习常见的损失函数以及何时使用它们

推荐阅读

广东投入6亿元要将南药打造成富民兴村产业

2020 nba排行榜

年审|全国不足500只，\百鸟之王\绿孔雀逼停云南玉溪39亿水电项目

生肖|7月末3大生肖财富如雨下，财神上门，事业高升，家业兴隆

中年“翁阿姨，今天又来义务劳动啦！”

狗狗|珠江河面惊现漂浮的动物尸体传出浓烈气味

#鲁迪·戈贝尔#噩耗！2名球员感染新冠病毒离世！戈贝尔也危险了

中国|杨凯生：完善中国特色的银行业公司治理

【芯片】海思芯片命悬一线，台积电至关重要，华为没想到任正非一语成谶

北京，啥样的家庭算top1%的家庭

西服套装：童瑶也很有“国际范”，身穿黑色西服套装气场全开，高级优雅

天空迷彩|一架美军无人机被击落，伊朗否认：与我无关，波斯湾上空传来巨响

『小彭说星』4月大吉，吉星相随，桃花追着跑，苦难到头的属相，3月熬完

分期付款买车需要装gps定位-,分期购车然后车上是不是装有GPS定位-

【瑞幸股东特别大会结果出炉】瑞幸股东特别大会结果出炉：免去董事长陆正耀职务

孕妇多久吃一次鲫鱼

炎黄子孙风水文化|太难搞，心累！这几个生肖的人最难相处

核酸检测|活动轨迹公布！瑞丽城区全员开展核酸检测，费用由政府承担

洗面奶|中性温和的洗面奶有哪些十大温和洗面奶品牌排行榜

美国_社会|美媒：这件在中国再正常不过的事，美国如果做到能少损失1万亿美元！