RL2022-05-08 20:30:45
没听明白DF到底是单个文件还是文件集的指标?图1DF公式的分母总句数不是说是文件集的句数吗?为啥后面的TF-IDF又说要和DF单个文件集统一都是单个文件?
回答(1)
Essie2022-05-09 11:40:49
你好,根据原版书对DF的定义(Document Frequency): Defined as the number of documents (i.e., sentences) that contain a given word divided by the total number of sentences。所以它number of documents的表述其实就是sentences,它是站在单个文件的角度去看的。
- 评论(1)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片


