Ozr2024-05-08 18:56:16
这里的frequency是指第一步剔除高频词汇之后,的高频词汇吗
回答(1)
爱吃草莓的葡萄2024-05-09 13:41:29
同学你好。同学具体指的是哪个。特征选择方法中的频率Frequency,是用于词汇修剪,通过过滤所有文本中具有极高和极低 TF 值的记号来消除噪音特征。
- 评论(0)
- 追问(2)
- 追问
-
因为我记得前一页ppt写的要剔除高频的词汇,然后这一页又是要挑高频的词汇
- 追答
-
同学你好。明白同学你的疑问了。
前面那页讲的是为什么进行特征选择,因为高频与低频的记号/特征没有意义不太重要,因此需要剔除。
然后本页讲的是特征选择的方法(或者剔除高低频特征的方法),第一个方法就是最常见的频率计量,计量一个单词在文章中出现的频率,如果特征太高或者太低我们就将其剔除,这就是特征选择。
评论
0/1000
追答
0/1000
+上传图片

