天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

Kaki2022-05-28 16:11:52

为何第一问是指TF而不是TF–IDF的大小?要如何分辨?

查看试题

回答(1)

Essie2022-05-28 18:46:43

你好,根据文中第二段“Following an exploratory data analysis that revealed Dataset ABC’s most frequent tokens”,这里说的是数据库中最常见的标识符,是和出现的频次有关,因此指的是term frequency词频,词频也是整个语料库中衡量的一个指标。
而TF-IDF是词频和逆向文件频率的乘积,比如说更高的TF*IDF代表表示单词在较少数量的文档中出现的频率更高,说明这个词在文档中的信息量越大。
而这里没提到信息量等衡量的方式,只是说标识符出现的频率。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录