圆同学2022-07-08 18:17:37
课后题第11题,细选项剔除的高频和低频词,为什么要剔除呢?为了怎样的目标呢?
回答(1)
Essie2022-07-11 17:24:56
你好,在文本学习中,词频较高的词一般是a the of这样的停用词,词频极低的词对于文本学习的意义不大,在文本中起到的作用较低。所以极高和极低词频的词都会因为学习意义不大,包含信息较少而被剔除。目的是为了尽量少的输入垃圾信息进入模型中影响模型的输出或者增加不必要的计算量。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片