分类模型的评价指标Fscore

小书匠 深度学习

分类方法常用的评估模型好坏的方法.

0.预设问题

假设我现在有一个二分类任务,是分析100封邮件是否是垃圾邮件,其中不是垃圾邮件有65封,是垃圾邮件有35封.模型最终给邮件的结论只有两个:是垃圾邮件不是垃圾邮件.

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

经过自己的努力,自己设计了模型,得到了结果,分类结果如下:

  • 不是垃圾邮件70封(其中真实不是垃圾邮件60封,是垃圾邮件有10封)
  • 是垃圾邮件30封(其中真实是垃圾邮件25封,不是垃圾邮件5封)

现在我们设置,不是垃圾邮件.为正样本,是垃圾邮件为负样本
我们一般使用四个符号表示预测的所有情况:

  • TP(真阳性):正样本被正确预测为正样本,例子中的60
  • FP(假阳性):负样本被错误预测为正样本,例子中的10
  • TN(真阴性):负样本被正确预测为负样本,例子中的25
  • FN(假阴性):正样本被错误预测为负样本,例子中的5

1.评价方法介绍

先看最终的计算公式:

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第1张

1.Precision(精确率)

关注预测为正样本的数据(可能包含负样本)中,真实正样本的比例
计算公式

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第2张

例子解释:对上前面例子,关注的部分就是预测结果的70封不是垃圾邮件中真实不是垃圾邮件占该预测结果的比率,现在Precision=60/(600+10)=85.71%

2.Recall(召回率)

关注真实正样本的数据(不包含任何负样本)中,正确预测的比例
计算公式

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第3张

例子解释:对上前面例子,关注的部分就是真实有65封不是垃圾邮件,这其中你的预测结果中有多少预测正确了,Recall=60/(60+5)=92.31%

3.F-score中β值的介绍

β是用来平衡Precision,Recall在F-score计算中的权重,取值情况有以下三种:

  • 如果取1,表示Precision与Recall一样重要
  • 如果取小于1,表示Precision比Recall重要
  • 如果取大于1,表示Recall比Precision重要

一般情况下,β取1,认为两个指标一样重要.此时F-score的计算公式为:

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第4张

前面计算的结果,得到Fscore=(2*0.8571*0.9231)/(0.8571+0.9231)=88.89%

3.其他考虑
预测模型无非就是两个结果

  • 准确预测(不管是正样子预测为正样本,还是负样本预测为负样本)
  • 错误预测

那我就可以直接按照下面的公式求预测准确率,用这个值来评估模型准确率不就行了

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第5张

那为什么还要那么复杂算各种值.理由是一般而言:负样本远大于正样本

可以想象,两个模型的TN变化不大的情况下,但是TP在两个模型上有不同的值,TN>>TP是不是可以推断出:两个模型的(TN+TP)近似相等.这不就意味着两个模型按照以上公式计算的Accuracy近似相等了.那用这个指标有什么用!!!

所以说,对于这种情况的二分类问题,一般使用Fscore去评估模型.

需要注意的是:Fscore只用来评估二分类的模型,Accuracy没有这限制

参考
1.机器学习中的 precision、recall、accuracy、F1 Score
2.分类模型的评估方法-F分数(F-Score)

学技术之路太难,唯有坚持不懈!!! 好文要顶 关注我 收藏该文 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第6张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第7张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第8张 7秒记忆的战斗机
关注 - 1
粉丝 - 11 +加关注 1 0 « 上一篇: Numpy中数据的常用的保存与读取方法
» 下一篇: LSTM的神经元个数
posted @ 2018-06-06 16:55 7秒记忆的战斗机 阅读( 3064) 评论( 0) 编辑 收藏 刷新评论 刷新页面 返回顶部 发表评论

昵称:

评论内容: 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第9张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第10张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第11张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第12张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第13张 二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第14张

不改了 退出 订阅评论

[Ctrl+Enter快捷键提交]

【推荐】超50万C++/C#源码: 大型实时仿真组态图形源码
【推荐】百度智能云品牌升级,云服务器福利低至0.5折
【推荐】专业便捷的企业级代码托管服务 - Gitee 码云
【活动】2019第四届全球人工技术大会解码“智能+时代”
相关博文:
· caffe---测试模型分类结果并输出(python )
· PowerDesigner模型分类
· 机器学习之模型评价指标
· 混合高斯模型分类
· 机器学习-模型评价指标
最新新闻
· 小米手机预装的安全应用被发现存在安全隐患
· 金山云、小米金融、新网银行达成战略合作 共建金融科技新生态
· 英国淘汰纸质火车票 代之以手机智能车票
· 特斯拉加快部署第三代Autopilot自动驾驶计算机
· 台积电一季度营收71亿美元 下滑12%
» 更多新闻...,小书匠 深度学习

分类方法常用的评估模型好坏的方法.

0.预设问题

假设我现在有一个二分类任务,是分析100封邮件是否是垃圾邮件,其中不是垃圾邮件有65封,是垃圾邮件有35封.模型最终给邮件的结论只有两个:是垃圾邮件不是垃圾邮件.

经过自己的努力,自己设计了模型,得到了结果,分类结果如下:

  • 不是垃圾邮件70封(其中真实不是垃圾邮件60封,是垃圾邮件有10封)
  • 是垃圾邮件30封(其中真实是垃圾邮件25封,不是垃圾邮件5封)

现在我们设置,不是垃圾邮件.为正样本,是垃圾邮件为负样本
我们一般使用四个符号表示预测的所有情况:

  • TP(真阳性):正样本被正确预测为正样本,例子中的60
  • FP(假阳性):负样本被错误预测为正样本,例子中的10
  • TN(真阴性):负样本被正确预测为负样本,例子中的25
  • FN(假阴性):正样本被错误预测为负样本,例子中的5

1.评价方法介绍

先看最终的计算公式:

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第15张

1.Precision(精确率)

关注预测为正样本的数据(可能包含负样本)中,真实正样本的比例
计算公式

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第16张

例子解释:对上前面例子,关注的部分就是预测结果的70封不是垃圾邮件中真实不是垃圾邮件占该预测结果的比率,现在Precision=60/(600+10)=85.71%

2.Recall(召回率)

关注真实正样本的数据(不包含任何负样本)中,正确预测的比例
计算公式

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第17张

例子解释:对上前面例子,关注的部分就是真实有65封不是垃圾邮件,这其中你的预测结果中有多少预测正确了,Recall=60/(60+5)=92.31%

3.F-score中β值的介绍

β是用来平衡Precision,Recall在F-score计算中的权重,取值情况有以下三种:

  • 如果取1,表示Precision与Recall一样重要
  • 如果取小于1,表示Precision比Recall重要
  • 如果取大于1,表示Recall比Precision重要

一般情况下,β取1,认为两个指标一样重要.此时F-score的计算公式为:

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第18张

前面计算的结果,得到Fscore=(2*0.8571*0.9231)/(0.8571+0.9231)=88.89%

3.其他考虑
预测模型无非就是两个结果

  • 准确预测(不管是正样子预测为正样本,还是负样本预测为负样本)
  • 错误预测

那我就可以直接按照下面的公式求预测准确率,用这个值来评估模型准确率不就行了

二分类问题F-score评判指标(转载),分类模型的评价指标Fscore 随笔 第19张

那为什么还要那么复杂算各种值.理由是一般而言:负样本远大于正样本

可以想象,两个模型的TN变化不大的情况下,但是TP在两个模型上有不同的值,TN>>TP是不是可以推断出:两个模型的(TN+TP)近似相等.这不就意味着两个模型按照以上公式计算的Accuracy近似相等了.那用这个指标有什么用!!!

所以说,对于这种情况的二分类问题,一般使用Fscore去评估模型.

需要注意的是:Fscore只用来评估二分类的模型,Accuracy没有这限制

参考
1.机器学习中的 precision、recall、accuracy、F1 Score
2.分类模型的评估方法-F分数(F-Score)

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄