白同学2023-05-12 16:35:00
这里的n-gram在text wrangling不是已经做过了么?为何在text exploration 中要再做一次?
回答(1)
爱吃草莓的葡萄2023-05-12 17:20:24
同学你好。首先说明一下,此处特征工程处理技术可能与前面文本预处理技术重复。
首先前面文本预处理中N-grams,例如老师举的“天”“安”“门”不能单独展示,需要作为一个有序整体“天安门”来呈现,因此我们将其进行相应处理。
其次后面的是文本探索,可能我们将明显的文本数据进行打包处理,但是不明显的就真没有意义吗,显然不是,因此我们此处特征工程进行探索,需要用到N-grams。例如“天”“安”“门”“地”,很明显我们会将“天安门”作为一个整体,但是能不能重新构成一个单词呢,显然也可以,我们重新编排构成“地安门”,有没有意义那就是后面步骤了。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

