韩同学2022-02-15 02:42:22
为什么unequal distribution的情况下 F1 score这个数据更好?
回答(1)
Essie2022-02-15 09:43:42
你好,因为F1 score是precision和recall的调和平均数,当样本数据的体量有着较大幅度的差距时,我们会使用调和平均数。比如说现在有3个数据,其中a数据是几十万,b数据是几千,c数据是几十,那么数据的体量非常不均匀,此时用调和平均数处理会更好。因为调和平均数的计算等于总体各统计变量倒数的算术平均数的倒数,可以很大情况上减少数据体量之间巨大差异的影响。
- 评论(1)
- 追问(4)
- 追问
-
你的逻辑是“调和平均可以缩小数据之间的巨大差距”。F1是算precision和recall的算数平均。即使样本数据内部可能差距比较大,但算出来precision和recall并不一定差距很大呀,例如本题中的表1。这怎么解释?
- 追答
-
你好,F1 score是precision和recall的调和平均数,不是算术平均数。F1在数据有极大不均匀分布的时候使用更合适。麻烦同学说一下具体是哪道题目的表一,或者可以截个图。举个例子说吧,比如孕妇去做唐筛,来检查小孩是否天生会有某些缺陷,但是99.9999%的概率都是小孩可以通过该项测试,只有0.0001%是有问题的,像这种数据,本身就存在着很严重的不均衡情况,这时候计算出的precision或recall会有很大的扭曲程度在内,所以使用F1 score会更好。
- 追问
-
问题如图。
- 追答
-
你好,排除recall和precision在这个例子中有很大差距这句话,你表格里唐筛这个例子TP=1,TN=9990,这就符合数据之间存在unequal unequal class distribution,所以用F1 score是比accuracy更好的。
recall和precision会受TP FP FN三者影响,TP是正确预测出有缺陷小孩的例子,FP是没缺陷但是被误诊为是有缺陷的孩子,FN是有问题却被误诊为没缺陷的孩子。如果抽样中的数字不是你写的这三种情况,而是FP是600,FN是200,TP是100。那么recall就是precision的2倍了,所以在一定程度上也取决于模型的严格程度以及模型的抽样。


评论
0/1000
追答
0/1000
+上传图片