别同学2022-05-22 17:25:10
请问课后题reading5第16题怎样理解呢?
回答(1)
Essie2022-05-22 23:29:54
你好,题目中说基于dataset ABC 使用的方法,可能携带重要信息可以用来区分文本中隐含的情绪,给这些标识符的赋值应该是高还是低还是中等。
我们在一个文本内分析词频的时候,适中词频值的标识符最有可能携带重要信息,可以用来区分文本中隐含的情绪,所以B选项是正确的。因为如果词频很高,代表大概率是没什么贡献的停用词,像a/the 这类的。而词频如果很低,说明了大概率是对文本含义不重要的稀疏词汇。所以词频太高太低的词,都不能很好的分析文本内的情绪。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片