张同学2023-02-24 21:43:41
课后题module7第17题,这道题问的是什么意思,为什么选B没选A和C,答案没看懂
回答(1)
Essie2023-02-25 14:38:04
你好,题目文在数据的清洗和预处理的过程中,应该去除什么?
文本清理涉及以下步骤:1. 删除HTML标签;2. 删除标点符号; 3. 删除数字;4.删除空格。
数据预处理的过程中涉及以下步骤:1. 把所有大写都转换为小写;2. 删除停用词a is the这类;3. 词干提取Stemming;4.词形还原Lemmatization。
A和C中的html tags和white spaces是对的,但是scaling和winsorization是对结构数据而言的,不是针对文本数据。所以只有B中描述的两项是完全适用于文本数据的。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

