天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

Asher2022-02-19 01:53:29

这个问题还没结束 这两个虽然在一个wranggling 一个是engenneing 但是他们的描述都是创建一个新的variable 所以区别到底是什么还没讲清楚呢

回答(1)

Essie2022-02-19 15:59:00

你好,data wrangling是数据整理,是在数据的预处理阶段,为了对收集来的、经过清洗以后的数据,进行进一步的处理,使这些数据准备好进行ML模型训练。这一步骤里包含提取,汇总,过滤,选择,转换。其中提取就是从当前变量中创建一个新变量,以便于分析和训练机器学习的模型。也就是说数据整理中有一个方式是可以创建一个新变量,但是到此阶段还没有对数据进行深入研究,只是分析师认为,这样做简单的改变会利于之后的分析。
而在数据整理后的下一个步骤是data exploration数据探索,它是对准备好的数据进行深入的研究,会考虑更深层次数据之间的关系,比如说数据的分布等。其中数据探索又可以分为探索性数据分析、特征选择和特征工程。特征工程是在经过更深入的研究,了解了数据集的内在结构以后,分析师可以继续通过改变或转换现有特征来创建新的、更有意义的特征。
所以本质在于它们在整个处理中,处于不同的阶段。数据整理中的提取还没有对数据进行深入研究,特征工程阶段需要已经了解了数据的内在结构。操作都是创建了新的变量,只是难度大大不同。

  • 评论(0
  • 追问(3
评论
追问
我知道这两个的区别呢 我是我们回顾一下我之前提的问题 有一个extraction属于wrangling 它和feature engineering都是描述的创建一个新的variable 这两个没有区别 我们直接说 题目中怎么区分
追问
回顾一下 图一的extraction和图三的FE 描述都是用现有的数据合成新的数据 区别在哪里 我不是问wrangling和exploration的区别 我就问这两个描述的区别 没有区别的话题没法做
追答
你好,如果你只知道创建了一个新的变量,那么extraction和FE都是有可能的,题目也不会把这两个选项放在一起,然后又说的很模糊。 区别在于,提取中并没有对数据进行系统的分析,是在数据预处理阶段。如果题目说了研究了特征之间的关系和分布,创建了一个新的变量那么就属于FE。

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录