天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

张同学2023-02-24 21:43:41

课后题module7第17题,这道题问的是什么意思,为什么选B没选A和C,答案没看懂

回答(1)

Essie2023-02-25 14:38:04

你好,题目文在数据的清洗和预处理的过程中,应该去除什么?
文本清理涉及以下步骤:1. 删除HTML标签;2. 删除标点符号; 3. 删除数字;4.删除空格。
数据预处理的过程中涉及以下步骤:1. 把所有大写都转换为小写;2. 删除停用词a is the这类;3. 词干提取Stemming;4.词形还原Lemmatization。
A和C中的html tags和white spaces是对的,但是scaling和winsorization是对结构数据而言的,不是针对文本数据。所以只有B中描述的两项是完全适用于文本数据的。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录