LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 389|回复: 0

分类器的性能

[复制链接]
发表于 2023-12-26 15:57:34 | 显示全部楼层 |阅读模式

分类器的性能

在实现机器学习算法之后,我们需要找出模型的有效性。 衡量有效性的标准可以基于数据集和度量标准。 为了评估不同的机器学习算法,我们可以使用不同的性能指标。 例如,假设使用分类器来区分不同对象的图像,可以使用分类性能指标,如平均准确率,AUC等。从某种意义上说,我们选择评估机器学习模型的指标是非常重要的,因为指标的选择会影响机器学习算法的性能如何被测量和比较。 以下是一些指标 -

混乱矩阵

基本上它用于输出可以是两种或更多种类的分类问题。 这是衡量分类器性能的最简单方法。 混淆矩阵基本上是一个包含两个维度即“实际”和“预测”的表格。 这两个维度都有“真正的正面(TP)”,“真正的负面(TN)”,“错误的正面(FP)”,“错误的否定(FN)”。



在上面的混淆矩阵中,1表示正类,0表示负类。
以下是与混淆矩阵相关的术语 -

真正 - 当实际的数据点类别为1并且预测也为1时,TP就是这种情况。
真负 - 当数据点的实际类别为0并且预测也为0时,TN就是这种情况。
假正 - 当实际的数据点类别为0并且预测也为1时,FP就是这种情况。
假负 - FN是数据点的实际类别为1且预测也为0的情况。

准确性

混淆矩阵本身并不是一个性能指标,但几乎所有的性能矩阵均基于混淆矩阵。 其中之一是准确性。 在分类问题中,它可能被定义为由模型对各种预测所做的正确预测的数量。 计算准确度的公式如下 -



精确

它主要用于文件检索。 它可能被定义为返回的文件有多少是正确的。 以下是计算精度的公式 -



召回或灵敏度

它可能被定义为模型返回的正数有多少。 以下是计算模型召回/灵敏度的公式 -



特异性

它可以定义为模型返回的负数有多少。 这与召回完全相反。 以下是计算模型特异性的公式 -




//更多请阅读:https://www.yiibai.com/ai_with_python/ai_with_python_supervised_learning_classification.html


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表