天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

阿同学2023-06-26 18:03:12

CF, TF, DF, IDF, TF-IDF公式特点对比

回答(1)

爱吃草莓的葡萄2023-06-27 10:07:46

同学你好。

TF是词频,有两层分类,一类是在整个语料库层面又称为(collection frequency),TF=总的该单词出现次数/整个语料库单词数;一类是在句子层面,TF=在句子中出现该单词次数/句子单词总数。

DF是文本频率,DF=含有该单词的句子数/总的句子数。

IDF是逆向文本频率,衡量一个术语在整个语料库中的独特性的相对指标,IDF=log(1/DF)。

TF–IDF,句子层级的TF乘以整个数据集单词的IDF,TF-IDF = TF × IDF.

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录