天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

丁同学2023-05-12 18:19:21

Q3, 文本数据的处理有哪些步骤?预处理和整理阶段有什么不同,分别包括哪几项?文本清洗属于哪个环节?以上问题麻烦老师帮助梳理解答一下,谢谢

查看试题

回答(1)

最佳

爱吃草莓的葡萄2023-05-15 13:50:02

同学你好。
数据处理包括两方面,一是数据准备,二是数据预处理。

数据清洗(data cleansing)另一个名字叫做数据准备(data preparation) 。在非结构数据中,包括移除网络符号(http)、标点符号、数字、空格符号。

数据清洗下一步就是数据预处理(data preprocessing),另一个名字叫做数据整理(data wrangling)。在非结构数据中,包括单词小写、去除停止词、词干还原(stemming)、词根还原(Lemmatization)。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录