bag_of_words是否等于set_of_N-grams?第九题为什么B不正确呢？



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>CFA二级

Leo2022-05-10 22:47:17

bag_of_words是否等于set_of_N-grams?第九题为什么B不正确呢？

Big Data Projects 查看试题

回答（1）

Essie2022-05-11 10:48:42

你好，第三步所得出的结果是词包（BOW），他是经过tokenization和normalization之后所得出的，本题选A。它不等于set-of N-grams，因为BOW只收集所有单词或标识符，但不考虑单词出现的顺序和位置。而N-grams很好的解决了这一点，如果文本的顺序很重要，则可以使用N元分词来表示单词序列。