回答(1)
Huang2024-04-05 01:35:45
同学你好,
在TF中,频率非常高的词会是一些停用词,例如the,这个没什么意义。
而频率很低的词是一些罕见的词,因为只出现一两次就没什么分析的必要,对于分析这两种词都没什么用。
TF很高和很低的词被认为是noisy terms。
原版书中的解释:
Terms with low TF are mostly rare terms (like proper nouns), ones appearing only once or twice in the data. They do not contribute to differentiating sentiment.
Terms with high TF are mostly stop terms, present in most sentences, and so do not contribute to differentiating sentiment.
- 评论(0)
- 追问(2)
- 追问
-
怎么判断他频率是过高或过低呢?例如“the”的频率是0.49,为什么就是高呢?
- 追答
-
题目里面已经写了这个是Exhibit 2 Words with Highest and Lowest Frequency Value,而且题干说了是based on Exhibit 2 来回答,这个不需要主观判断的,一般题目会给很明显的字眼告诉你是过高还是过低。
评论
0/1000
追答
0/1000
+上传图片
