天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

曹同学2023-02-08 10:57:47

老师,Q9说的是distinct而不是正常的set,由于是特殊的,那不应该是n-gram这种经过特殊处理的吗?

查看试题

回答(1)

Essie2023-02-09 11:06:38

你好,文中step 3中说对标准化过后的词组创建单独的token,distinct set就是拆分成一个一个完全分开的单独token,所以这里描述的就是文档术语矩阵的建立。
如果提到了文本的顺序很重要,那么就可以使用N元分词来表示单词序列。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录