137****01292024-02-28 11:31:03
Q1, 题目有说Bector then computes TF–IDF for several words…,所以为什么不是TF- IDF,而是TF?这里的words和前面的token区别是什么
查看试题回答(1)
Huang2024-02-28 16:18:36
同学你好,
TF–IDF是两个部分:term frequency-inverse document frequency
term frequency 是单个文件的某个词出现的频率。
document frequency 只整个文件集中,出现了某个次的文件出现的频率。
这一题问的是词出现的频率,就是看term frequency。
Token是文本单位的,例如可以把一个词分成几个token。
-----------------------------------
如果满意答疑可【采纳】,仍有疑问可【追问】
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
