Asher2022-02-19 01:53:29
这个问题还没结束 这两个虽然在一个wranggling 一个是engenneing 但是他们的描述都是创建一个新的variable 所以区别到底是什么还没讲清楚呢
回答(1)
Essie2022-02-19 15:59:00
你好,data wrangling是数据整理,是在数据的预处理阶段,为了对收集来的、经过清洗以后的数据,进行进一步的处理,使这些数据准备好进行ML模型训练。这一步骤里包含提取,汇总,过滤,选择,转换。其中提取就是从当前变量中创建一个新变量,以便于分析和训练机器学习的模型。也就是说数据整理中有一个方式是可以创建一个新变量,但是到此阶段还没有对数据进行深入研究,只是分析师认为,这样做简单的改变会利于之后的分析。
而在数据整理后的下一个步骤是data exploration数据探索,它是对准备好的数据进行深入的研究,会考虑更深层次数据之间的关系,比如说数据的分布等。其中数据探索又可以分为探索性数据分析、特征选择和特征工程。特征工程是在经过更深入的研究,了解了数据集的内在结构以后,分析师可以继续通过改变或转换现有特征来创建新的、更有意义的特征。
所以本质在于它们在整个处理中,处于不同的阶段。数据整理中的提取还没有对数据进行深入研究,特征工程阶段需要已经了解了数据的内在结构。操作都是创建了新的变量,只是难度大大不同。
- 评论(0)
- 追问(3)
- 追问
-
我知道这两个的区别呢 我是我们回顾一下我之前提的问题 有一个extraction属于wrangling 它和feature engineering都是描述的创建一个新的variable 这两个没有区别 我们直接说 题目中怎么区分
- 追问
-
回顾一下 图一的extraction和图三的FE 描述都是用现有的数据合成新的数据 区别在哪里 我不是问wrangling和exploration的区别 我就问这两个描述的区别 没有区别的话题没法做
- 追答
-
你好,如果你只知道创建了一个新的变量,那么extraction和FE都是有可能的,题目也不会把这两个选项放在一起,然后又说的很模糊。
区别在于,提取中并没有对数据进行系统的分析,是在数据预处理阶段。如果题目说了研究了特征之间的关系和分布,创建了一个新的变量那么就属于FE。


评论
0/1000
追答
0/1000
+上传图片