爱同学2023-04-01 12:00:39
老师说DF是单个文件来看的,怎么分母又是所有文件数??
回答(1)
爱吃草莓的葡萄2023-04-02 12:51:26
同学你好。DF是从单个文件来看的,这里存在中英表述不同的区别。
DF是英文定义为the number of documents (i.e., sentences) that contain a given word divided by the total number of sentences,中文指在单个文件(文章)中包含给定单词的句子的数量除以句子总数(例如某个文件,也即文章,包含100个句子,其中包含特定单词的句子有10个,那么DF=10/100)。
这里易混淆的是document意思,英文给定的意思是句子之意,但中文意思是指文件文档之意,容易误解为我们平常所理解的那种文件意思。直接按照中文意思来掌握,document=sentences,文件=句子。
此外TF*IDF中,TF是指在句子层面,即单个句子中含有特定单词的数量除以句子的单词总数。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

