你还未登录〜
听歌而来,送我踏青云〜
0元
充值
0橙宝
老师,Q9说的是distinct而不是正常的set,由于是特殊的,那不应该是n-gram这种经过特殊处理的吗?
你好,文中step 3中说对标准化过后的词组创建单独的token,distinct set就是拆分成一个一个完全分开的单独token,所以这里描述的就是文档术语矩阵的建立。如果提到了文本的顺序很重要,那么就可以使用N元分词来表示单词序列。
0/1000
+上传图片
登录金程网校
用户名或密码不匹配,请重新输入
两周内免登录
注册金程账号
注册金程网校
已有账号登录