RL2022-08-27 21:44:57
1.IDF内容部分的高低指的是DF的高低还是1/DF的?2.为什么取log,可以再解释下吗?3.TF分位单个文件,整个文件集的TF对吗?
回答(1)
最佳
Essie2022-08-29 11:41:15
你好,1.蓝色框里的高—重要,低—不重要是指对DF取倒数,针对1/DF而言的
2.取对数是为了降量级,因为如果句子很长,那么包含的单词就多,就更有概率包含重要单词。但是句子越短包含的单词越少,包含重要单词的概率就更低了,但并不是说句子越长越好,为了避免这个问题所以取对数缩量级。
3.对的,有单个文件的TF,和文件集的TF。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片