阿同学2023-06-26 18:03:12
CF, TF, DF, IDF, TF-IDF公式特点对比
回答(1)
爱吃草莓的葡萄2023-06-27 10:07:46
同学你好。
TF是词频,有两层分类,一类是在整个语料库层面又称为(collection frequency),TF=总的该单词出现次数/整个语料库单词数;一类是在句子层面,TF=在句子中出现该单词次数/句子单词总数。
DF是文本频率,DF=含有该单词的句子数/总的句子数。
IDF是逆向文本频率,衡量一个术语在整个语料库中的独特性的相对指标,IDF=log(1/DF)。
TF–IDF,句子层级的TF乘以整个数据集单词的IDF,TF-IDF = TF × IDF.
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
