分类器的性能

xhz · 发表于 2023-12-26 15:57:34

分类器的性能

在实现机器学习算法之后，我们需要找出模型的有效性。衡量有效性的标准可以基于数据集和度量标准。为了评估不同的机器学习算法，我们可以使用不同的性能指标。例如，假设使用分类器来区分不同对象的图像，可以使用分类性能指标，如平均准确率，AUC等。从某种意义上说，我们选择评估机器学习模型的指标是非常重要的，因为指标的选择会影响机器学习算法的性能如何被测量和比较。以下是一些指标 -

混乱矩阵

基本上它用于输出可以是两种或更多种类的分类问题。这是衡量分类器性能的最简单方法。混淆矩阵基本上是一个包含两个维度即“实际”和“预测”的表格。这两个维度都有“真正的正面(TP)”，“真正的负面(TN)”，“错误的正面(FP)”，“错误的否定(FN)”。

在上面的混淆矩阵中，1表示正类，0表示负类。
以下是与混淆矩阵相关的术语 -

真正 - 当实际的数据点类别为1并且预测也为1时，TP就是这种情况。
真负 - 当数据点的实际类别为0并且预测也为0时，TN就是这种情况。
假正 - 当实际的数据点类别为0并且预测也为1时，FP就是这种情况。
假负 - FN是数据点的实际类别为1且预测也为0的情况。

准确性

混淆矩阵本身并不是一个性能指标，但几乎所有的性能矩阵均基于混淆矩阵。其中之一是准确性。在分类问题中，它可能被定义为由模型对各种预测所做的正确预测的数量。计算准确度的公式如下 -

精确

它主要用于文件检索。它可能被定义为返回的文件有多少是正确的。以下是计算精度的公式 -

召回或灵敏度

它可能被定义为模型返回的正数有多少。以下是计算模型召回/灵敏度的公式 -

特异性

它可以定义为模型返回的负数有多少。这与召回完全相反。以下是计算模型特异性的公式 -

//更多请阅读：https://www.yiibai.com/ai_with_python/ai_with_python_supervised_learning_classification.html

		自动登录	找回密码
密码			注册

分类器的性能

本帖子中包含更多资源

浏览过的版块