yuan2022-08-03 10:24:33
DF分母不是总文件数吗?为什么老师讲取log的时候说越长文章包含词越多,总文件数和词没关系吧
回答(1)
Essie2022-08-03 15:55:33
你好,DF的分子是含有某个词的句子数量,分母是文件中的句子总数,如果文章越长,所包含的句子越多,那么分母就会越大,见下图。
- 评论(0)
- 追问(2)
- 追问
-
把这个slide老师讲的不太准确吗
- 追答
-
老师说的也没错,课程里是站在文件集合的角度去说的,原版书给出的公式是站在单独文件的角度。所以它们的分母一个是文件总数,一个是文件中的句子总数,但是表达的含义和结论都是相通的。DF越高代表某个词不重要,DF越低说明某个词越有指向性。


评论
0/1000
追答
0/1000
+上传图片