天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

Ava2023-07-17 13:02:40

PCA和clustering都只真是线性吗,原因是什么?

回答(1)

最佳

爱吃草莓的葡萄2023-07-18 11:47:54

同学你好。首先需要弄清楚PCA与clustering代表的是什么。PCA是算法,clustering是机器学习问题类型之一。

线性与非线性讲的是数据是否复杂。

PCA算法是降维问题中的算法,既可以用于复杂的非线性数据也可以用于线性数据。

聚类问题在非线性数据情况下可以使用神经网络算法,在非复杂数据情况下可以使用K均值聚类或者分层聚类算法。

投资更加优秀的自己👍 ~如果满意回复可【采纳】,仍有疑问可【追问】,您的声音是我们前进的源动力,祝您生活与学习愉快!~

  • 评论(1
  • 追问(7
评论
追问
1.课程里这两种都是处理数据的不同算法,如下图。你这里说聚类不是算法? 聚类是只针对分类变量,非监督,线性吗?图里老师说的线性,你说的非线性? 2.PCA对数据线性非线性没有要求是吗?监督和非监督也没要求?变量是分类还是连续呢?
追问
另外还想问下,监督和非监督都只能用于分类变量,不能用于连续变量吗?
追答
额,同学你这里全部都是糊的,基础概念都没有分清楚,建议重新看一下机器学习算法分类的视频。 首先机器学习根据是否有标签库分为监督学习与非监督学习,监督学习可以用于处理回归与分类问题,非监督学习可以用于处理降维与聚类问题。 其次处理这些问题需要算法,例如PCA、CART等,这些算法不是每一类问题都可以处理。需要根据问题的类型与数据的复杂程度选择算法。 聚类问题属于非监督学习,它可以选择不同算法进行学习,这取决于数据的复杂程度,数据复杂可以选择神经网络,不太复杂可以选择K均值聚类等。老师那一行写的都是算法,聚类那里应该是K均值聚类或者分层聚类,省略了几个字,所以并没有任何不对的地方。 PCA是算法,用于解决降维问题,降维问题属于非监督学习,幸运的是降维问题中不论数据是否复杂都可以使用PCA算法。 监督或非监督讲的是数据是否有标签,分类或连续讲的是变量/问题是否连续,这时两个维度。数据有标签适用于监督学习,如果数据/问题还是定性的,那么就是分类问题;如果是定量的(连续),那么就是回归问题。 投资更加优秀的自己👍 ~如果满意回复可【采纳】,仍有疑问可【追问】,您的声音是我们前进的源动力,祝您生活与学习愉快
追问
那这里要先判定数据是非线性,才能考虑使用降维?讲降维时候是在非线性,但这总结时候是先判断是否需要降维?没有考虑非线性? 线性数据不适用监督和非监督,也没有打标签一说吗?
追答
同学你好。建议根据老师的回复认真回看一下视频,将算法分类理清,显著相关概念理解完全都是糊的。 1)之前老师的两次回复均提到,降维、聚类、回归、分类,这是机器学习的四类问题 ,是根据机器学习类型划分的,即非监督学习是前两个,监督学习是后两个问题。不是看数据是否是线性来判断是哪个问题。 2)降维问题的算法选择也需要考虑数据是否复杂,但是数据复杂与不复杂都可以使用PCA算法,因此还区分干嘛; 3)线性数据与监督/非监督一个是牛头一个是马嘴,都不搭边。老师之前说了,线性不线性看的是数据是否复杂,而监督/非监督看的是数据有没有标签。数据有标签可以用监督学习,有标签数据他也可以是复杂的也可以不是复杂的;数据没有标签可以用非监督学习,没有标签数据他也可以是复杂非线性也可以是简单线性的数据。并没有线性数据不适用监督和非监督,如果不适用那适用什么,机器学习分为监督学习与非监督学习,这两个不适用又没有第三个学习。 建议同学回看相关视频并根据老师的回复厘清基础分类知识,如果实在不行那就背住老师的回复。
追问
我提问写错了,我是要问连续变量不做监督非监督学习的区分对吗?
追答
同学你好。在监督与非监督学习下,会对数据类型进行划分,即分类数据和连续数据。监督学习下数据可能是分类数据也可能是连续数据,非监督学习下数据可能是分类数据也可能是连续数据。 监督学习下如果数据是分类数据,那么是分类问题;监督学习下如果数据是连续数据,那么是回归问题; 非监督学习下如果数据是分类数据,那么是聚类问题;非监督学习下如果数据是连续数据,那么是降维问题;

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录