xx2023-06-02 10:45:28
A选项只是出现的次数?B选项也有可能有mutual info低但也很重要的词呀
回答(1)
爱吃草莓的葡萄2023-06-02 16:59:47
同学你好。
A选项老师说的是chi-square相当于TF,可以这样类比判断,并不是说low chi-square就是出现的次数低。
B选项是互信息,衡量的是特征在文本类别中的贡献度。低的互信息如0,表明在所有文件中都有这个特征。那这表明这个特征没有指向性,说明特征很一般,一般的特征值。重要的东西不会经常出现,重要的东西会出现在该出现的地方。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

