time2021-11-11 22:43:06
第四题没有懂,什么意思
回答(1)
Essie2021-11-12 11:33:11
你好,这题说的是文本清洁后,进行了文本标准化以后的词是哪些,让我们选出来
首先我们需要知道文本标准化都是做了些什么事情?
1. Lowercasing,不区分“market”和“Market”,即所有的字母都转换为小写
2. Removal of stop words. 删除停止词。停止词是诸如the、is和a这样的常用词。出于文本分析和机器学习训练的目的,停用词不具有语义
3. Stemming. 词干提取。这是一种基于规则的算法,可将单词的所有变体转换为共同值。例如,integrate,integration和integrating都分配有共同的值integrat
4. Lemmatization. 词形还原。这涉及到将词的变形形式转换成词根
B选项有needing,这个就没有做词性还原,应该是need
C选项有HELP,没有做大写转小写的变化,应该是help
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

