回答(1)
Essie2022-05-28 18:46:43
你好,根据文中第二段“Following an exploratory data analysis that revealed Dataset ABC’s most frequent tokens”,这里说的是数据库中最常见的标识符,是和出现的频次有关,因此指的是term frequency词频,词频也是整个语料库中衡量的一个指标。
而TF-IDF是词频和逆向文件频率的乘积,比如说更高的TF*IDF代表表示单词在较少数量的文档中出现的频率更高,说明这个词在文档中的信息量越大。
而这里没提到信息量等衡量的方式,只是说标识符出现的频率。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片