为什么unequal distribution的情况下 F1 score这个数据更好？



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>CFA二级

韩同学2022-02-15 02:42:22

为什么unequal distribution的情况下 F1 score这个数据更好？

史纲

回答（1）

Essie2022-02-15 09:43:42

你好，因为F1 score是precision和recall的调和平均数，当样本数据的体量有着较大幅度的差距时，我们会使用调和平均数。比如说现在有3个数据，其中a数据是几十万，b数据是几千，c数据是几十，那么数据的体量非常不均匀，此时用调和平均数处理会更好。因为调和平均数的计算等于总体各统计变量倒数的算术平均数的倒数，可以很大情况上减少数据体量之间巨大差异的影响。

评论（1）
追问（4）

追问

你的逻辑是“调和平均可以缩小数据之间的巨大差距”。F1是算precision和recall的算数平均。即使样本数据内部可能差距比较大，但算出来precision和recall并不一定差距很大呀，例如本题中的表1。这怎么解释？

追答

你好，F1 score是precision和recall的调和平均数，不是算术平均数。F1在数据有极大不均匀分布的时候使用更合适。麻烦同学说一下具体是哪道题目的表一，或者可以截个图。举个例子说吧，比如孕妇去做唐筛，来检查小孩是否天生会有某些缺陷，但是99.9999%的概率都是小孩可以通过该项测试，只有0.0001%是有问题的，像这种数据，本身就存在着很严重的不均衡情况，这时候计算出的precision或recall会有很大的扭曲程度在内，所以使用F1 score会更好。

追问

问题如图。

追答

你好，排除recall和precision在这个例子中有很大差距这句话，你表格里唐筛这个例子TP=1，TN=9990，这就符合数据之间存在unequal unequal class distribution，所以用F1 score是比accuracy更好的。 recall和precision会受TP FP FN三者影响，TP是正确预测出有缺陷小孩的例子，FP是没缺陷但是被误诊为是有缺陷的孩子，FN是有问题却被误诊为没缺陷的孩子。如果抽样中的数字不是你写的这三种情况，而是FP是600，FN是200，TP是100。那么recall就是precision的2倍了，所以在一定程度上也取决于模型的严格程度以及模型的抽样。