50****632023-09-13 06:26:34
老师,请您解释一下Document frequency的计算和含义。分母总句数是文件集的总句数还是单个文件的总句数?相应的分子中的含有某个词的文件数(“句数”)能说明是指文件集的总句数吗?教材的一个例子中的分母2180这个数怎么来的,我没看明白
回答(1)
爱吃草莓的葡萄2023-09-13 10:27:16
同学你好。DF(文档频率)等于含有改词的句子数在整个语料库(文件集)中的占比。例如我搜集了几篇文章汇总成一个语料库,可以得知整个语料库的句子数为30000,如果含有创新标记的句子数有5000,那么DF=5000/3000.
2180是题目已经给出的,在整个语料库中总的句子数为2180.
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片



