139****98112023-04-29 12:56:09
第11问这里准确的说是不是因该关注very lowDF 和 very high term frequency (TF) values.上课老师是这么说的呀
查看试题回答(1)
爱吃草莓的葡萄2023-04-29 13:26:03
同学你好。这是两个不同的问题。第十一题文章说的是token可能是noise,想要去除掉,问哪些可能是noise。在TF计量中,过高的TF可能是停止词等无意义的单词,会造成noise;另外过低的TF可能并不能表达什么有用的信息,也会造成noise,需要去除掉。
另外同学你说的意思是准确来说应该是在去掉noise之后,越高的TF越好,因为越低的DF已经去除了最高的毫无意义的单词。
同学如果回答解决了您的疑惑,请给回答给予采纳。祝早日持证!
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
