Ava2023-07-17 13:02:40
PCA和clustering都只真是线性吗,原因是什么?
回答(1)
最佳
爱吃草莓的葡萄2023-07-18 11:47:54
同学你好。首先需要弄清楚PCA与clustering代表的是什么。PCA是算法,clustering是机器学习问题类型之一。
线性与非线性讲的是数据是否复杂。
PCA算法是降维问题中的算法,既可以用于复杂的非线性数据也可以用于线性数据。
聚类问题在非线性数据情况下可以使用神经网络算法,在非复杂数据情况下可以使用K均值聚类或者分层聚类算法。
投资更加优秀的自己👍 ~如果满意回复可【采纳】,仍有疑问可【追问】,您的声音是我们前进的源动力,祝您生活与学习愉快!~
- 评论(1)
- 追问(7)
- 追问
-
1.课程里这两种都是处理数据的不同算法,如下图。你这里说聚类不是算法?
聚类是只针对分类变量,非监督,线性吗?图里老师说的线性,你说的非线性?
2.PCA对数据线性非线性没有要求是吗?监督和非监督也没要求?变量是分类还是连续呢?
- 追问
-
另外还想问下,监督和非监督都只能用于分类变量,不能用于连续变量吗?
- 追答
-
额,同学你这里全部都是糊的,基础概念都没有分清楚,建议重新看一下机器学习算法分类的视频。
首先机器学习根据是否有标签库分为监督学习与非监督学习,监督学习可以用于处理回归与分类问题,非监督学习可以用于处理降维与聚类问题。
其次处理这些问题需要算法,例如PCA、CART等,这些算法不是每一类问题都可以处理。需要根据问题的类型与数据的复杂程度选择算法。
聚类问题属于非监督学习,它可以选择不同算法进行学习,这取决于数据的复杂程度,数据复杂可以选择神经网络,不太复杂可以选择K均值聚类等。老师那一行写的都是算法,聚类那里应该是K均值聚类或者分层聚类,省略了几个字,所以并没有任何不对的地方。
PCA是算法,用于解决降维问题,降维问题属于非监督学习,幸运的是降维问题中不论数据是否复杂都可以使用PCA算法。
监督或非监督讲的是数据是否有标签,分类或连续讲的是变量/问题是否连续,这时两个维度。数据有标签适用于监督学习,如果数据/问题还是定性的,那么就是分类问题;如果是定量的(连续),那么就是回归问题。
投资更加优秀的自己👍 ~如果满意回复可【采纳】,仍有疑问可【追问】,您的声音是我们前进的源动力,祝您生活与学习愉快
- 追问
-
那这里要先判定数据是非线性,才能考虑使用降维?讲降维时候是在非线性,但这总结时候是先判断是否需要降维?没有考虑非线性?
线性数据不适用监督和非监督,也没有打标签一说吗?
- 追答
-
同学你好。建议根据老师的回复认真回看一下视频,将算法分类理清,显著相关概念理解完全都是糊的。
1)之前老师的两次回复均提到,降维、聚类、回归、分类,这是机器学习的四类问题 ,是根据机器学习类型划分的,即非监督学习是前两个,监督学习是后两个问题。不是看数据是否是线性来判断是哪个问题。
2)降维问题的算法选择也需要考虑数据是否复杂,但是数据复杂与不复杂都可以使用PCA算法,因此还区分干嘛;
3)线性数据与监督/非监督一个是牛头一个是马嘴,都不搭边。老师之前说了,线性不线性看的是数据是否复杂,而监督/非监督看的是数据有没有标签。数据有标签可以用监督学习,有标签数据他也可以是复杂的也可以不是复杂的;数据没有标签可以用非监督学习,没有标签数据他也可以是复杂非线性也可以是简单线性的数据。并没有线性数据不适用监督和非监督,如果不适用那适用什么,机器学习分为监督学习与非监督学习,这两个不适用又没有第三个学习。
建议同学回看相关视频并根据老师的回复厘清基础分类知识,如果实在不行那就背住老师的回复。
- 追问
-
我提问写错了,我是要问连续变量不做监督非监督学习的区分对吗?
- 追答
-
同学你好。在监督与非监督学习下,会对数据类型进行划分,即分类数据和连续数据。监督学习下数据可能是分类数据也可能是连续数据,非监督学习下数据可能是分类数据也可能是连续数据。
监督学习下如果数据是分类数据,那么是分类问题;监督学习下如果数据是连续数据,那么是回归问题;
非监督学习下如果数据是分类数据,那么是聚类问题;非监督学习下如果数据是连续数据,那么是降维问题;
评论
0/1000
追答
0/1000
+上传图片



