天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

白同学2023-05-12 16:35:00

这里的n-gram在text wrangling不是已经做过了么?为何在text exploration 中要再做一次?

回答(1)

爱吃草莓的葡萄2023-05-12 17:20:24

同学你好。首先说明一下,此处特征工程处理技术可能与前面文本预处理技术重复。

首先前面文本预处理中N-grams,例如老师举的“天”“安”“门”不能单独展示,需要作为一个有序整体“天安门”来呈现,因此我们将其进行相应处理。

其次后面的是文本探索,可能我们将明显的文本数据进行打包处理,但是不明显的就真没有意义吗,显然不是,因此我们此处特征工程进行探索,需要用到N-grams。例如“天”“安”“门”“地”,很明显我们会将“天安门”作为一个整体,但是能不能重新构成一个单词呢,显然也可以,我们重新编排构成“地安门”,有没有意义那就是后面步骤了。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录