python + sklearn ︱分类效果评估——acc、recall、F1、ROC、回归、距离

  • 时间:2017-07-18
  • 分类:数据库/系统
  • 1596 人浏览
[导读]之前提到过聚类之后,聚类质量的评价: 聚类︱python实现 六大 分群质量评估指标(兰德系数、互信息、轮廓系数)

之前提到过聚类之后,聚类质量的评价:
聚类︱python实现 六大 分群质量评估指标(兰德系数、互信息、轮廓系数)
R语言相关分类效果评估:
R语言︱分类器的性能表现评价(混淆矩阵,准确率,召回率,F1,mAP、ROC曲线)

.

一、acc、recall、F1、混淆矩阵、分类综合报告 1、准确率 第一种方式:accuracy_score

第二种方式:metrics

宏平均比微平均更合理,但也不是说微平均一无是处,具体使用哪种评测机制,还是要取决于数据集中样本分布

宏平均(Macro-averaging),是先对每一个类统计指标值,然后在对所有类求算术平均值。
微平均(Micro-averaging),是对数据集中的每一个实例不分类别进行统计建立全局混淆矩阵,然后计算相应指标。(来源:谈谈评价指标中的宏平均和微平均)

其中average参数有五种:(None, ‘micro’, ‘macro’, ‘weighted’, ‘samples’)
.

2、召回率

.

3、F1

.

4、混淆矩阵

横为true label  竖为predict  
这里写图片描述
.

5、 分类报告

其中的结果:

包含:precision/recall/fi-score/均值/分类个数
.

6、 kappa score

kappa score是一个介于(-1, 1)之间的数. score>0.8意味着好的分类;0或更低意味着不好(实际是随机标签)

.

二、ROC 1、计算ROC值

2、ROC曲线

来看一个官网例子,贴部分代码,全部的code见:Receiver Operating Characteristic (ROC)

这里写图片描述

.

三、距离

.

1、海明距离

.

2、Jaccard距离

.

四、回归 1、 可释方差值(Explained variance score)

.

2、 平均绝对误差(Mean absolute error)

.

3、 均方误差(Mean squared error)

.

4、中值绝对误差(Median absolute error)

.

5、 R方值,确定系数


来源:本文为线上采编,如涉及作品内容、版权和其它问题,请及时与本网联系,我们将在第一时间删除!