Cold2022-07-23 15:59:23
老师好,TF可以针对某个词在单个文件出现的频率,也可以针对整个文件集出现的频率,那么拿到TF数据后如何识别它是针对单个文件,还是整个文件集的呢?另外对于这个case的第3问,说法不正确的句子,答案选了B选项,原因是TF不是针对文件集(Collection)的,而是针对句子(sentence)的,好像和这儿的讲义就矛盾了?TF也可以针对文件集的?
回答(1)
Essie2022-07-25 09:19:25
你好,题目如果给出了TF的相关信息,那么会直接说它是sentence level的还是collection level,所以是可以进行分辨的。
Q3中的statement 2说TF-IDF的计算是通过sentence level的TF和IDF相乘得到,但TF-IDF的计算是通过sentence level的TF得到,所以是错的。并不是说TF本身不能衡量整个文件集中的词频。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

