放荡的人生|分类器性能评判标准（Recall、P-R、F1、ROC等）你是否真的懂了？在机器学习算法中

前言在机器学习算法中，在模型训练出来之后，总会去寻找衡量模型性能的指标。评价指标是针对将相同的数据，使用不同的算法模型，或者输入不同参数的同一种算法模型，而给出这个算法或者参数好坏的定量指标。在模型评估过程中，往往需要使用多种不同的指标协作评估一个模型的好坏，因为众多的评价指标中，大部分指标只能片面的反应模型的一部分特点，那么对模型的评估就会比较片面，在算法落地后也会出现很多问题。根据评估指标的反馈进行模型调整，这些都是机器学习在模型评估阶段的关键问题，也是一名合格的算法工程师应当具备的基本功[文献1] 。
本文参考文献1,2 ，详细介绍机器学习分类任务的常用评价指标：准确率（Accuracy）、精确率（Precision）、召回率（Recall）、P-R曲线（Precision-RecallCurve）、F1Score、混淆矩阵（ConfuseMatrix）、ROC、AUC 。
1准确率（Accuracy）准确率定义如下：
真正例(TruePositive,TP)：标注的数据为正样本，被模型预测为正的正样本；假正例(FalsePositive,FP)：标注的数据为负样本，被模型预测为正的负样本；假负例(FalseNegative,FN)：标注的数据为负样本，被模型预测为负的正样本；真负例(TrueNegative,TN)：标注的数据为正样本，被模型预测为负的负样本；准确率是分类问题中最简单也是最直观的评价指标，但存在明显的缺陷，就是在数据的类别不均衡，特别是一种类别数据特别多另一种类别数据特别少的情况下，准确率就不能客观评价算法的优劣了。举个例子：当负样本占99%时，分类器把所有样本都预测为负样本，那么对于这个模型来说可以获得99%的准确率，所以在样本数据极度不均衡的时候，选用这种方式去评价一个模型是不可取的。
2精确率（Precision）精准率又叫查准率，容易与准确率弄混，请记住这个“精”字，它是针对一个类别预测结果而言的，含义是在所有被预测为正的样本中实际为正的样本的概率，在预测为正样本的结果中，有多少把握可以预测正确，因为其他类别的数据也可能被预测成为该类别。以二分类（以下不特殊说明，都以二分类为例介绍）来说其公式如下：
3召回率（Recall）召回率又叫查全率，它是针对原样本而言的，即在实际为正的样本中被预测为正样本的概率，其公式如下：

放荡的人生|分类器性能评判标准（Recall、P-R、F1、ROC等）你是否真的懂了？

推荐阅读

太饱谈球|七大名帅供巴萨选择，哈维的呼声最高！，官宣！巴萨主帅下课

数码东东卖得最少降得最快！银翼惨跌329！一加8被打脸

今日油价查询■就是这么大才大用，全新梅赛德斯-奔驰GLBSUV

李永强细说教育@阿水年薪就被曝光？MLXG：LPL年薪最高选手！，刚宣布加入TES

国际人物志TB|尸体一周后才被发现，印度老板和员工睡觉时被另一员工用铁锹打死

Ai要如何才可以取消轮廓，ai中如何把图片中抠出来的轮廓摆正

猫咪脚垫热是什么原因猫咪脚垫是热的还是凉的

『皮肤科赵恒光』得了汗斑，当心传染别人，皮肤科医生说要做好这3点

娱乐最小编|THE9舞台造型全芭比粉，其他人严严实实，虞书欣孔雪儿画风却不同

老板娘|留学生回国求职屡次“被拒”，HR直言：这种留学生，我们不认可

在上海，三十岁赚一万块每月，还有留下来的可能吗

这有港澳台|软银打算在这个国家收购TikTok业务

用洗发露洗衣服好吗男生用洗发露洗衣服好吗

央视|环卫工翻遍8吨垃圾找回学生丢失大学录取通知书

广州怎么查询公积金,广州住房公积金查询个人账户-

驱动中国|大起大落的特斯拉

「雷科技」Store在更多国家正式上线，疯狂扩张！苹果App

葛梦茹说娱乐|遭拒，被叫家长！，幽默笑话：发小二狗子高中时向语文老师表白

9月26日内蒙古自治区报告无新增确诊病例、疑似病例

搭配化妆师|再把小白鞋给穿上，夏天的气息就出来了！，乔欣穿衬衫裙外出