回答(1)
Essie2022-05-11 10:48:42
你好,第三步所得出的结果是词包(BOW),他是经过tokenization和normalization之后所得出的,本题选A。它不等于set-of N-grams,因为BOW只收集所有单词或标识符,但不考虑单词出现的顺序和位置。而N-grams很好的解决了这一点,如果文本的顺序很重要,则可以使用N元分词来表示单词序列。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片