-2023-02-24 22:28:26
老师,原版书课后题第33页第3题,请问为什么不能选择C,而是选择A呢?步骤2中提到“based on a wide variety of the most relevant financial and non-financial characteristic”是贴标签的意思吗?谢谢。
回答(1)
最佳
Essie2023-02-25 14:46:02
你好,based on a wide variety of the most relevant financial and non-financial characteristic不是贴标签的意思,这句话描述的不是数据本身的类型,而是指机器学习用来分类的方法,它说“基于各种财务相关和非财务的特征”将10000只股票分为20个group,但是具体这20类是根据什么指标进行分类,分出来是什么结果,我们并不知道,题目中也没有说明,所以这是非监督学习。三个选项中只有A是非监督学习的方法,所以选择K均值聚类。
如果题目说它用的是可视化的算法,将股票分为IPO目标和非IPO目标,或分成了成长股和价值股,这种情况才选CART。
PS: 麻烦下次同学下次说LM6的第三题,因为你说的原版书页数好像不太对,这个是原版书的第268页,不是33页,这样不太好定位题目,谢谢啦~
- 评论(0)
- 追问(9)
- 追问
-
谢谢老师。好的,我下次注意表明LM几哈。另外,请问一般case中,哪些词或字眼表示对应的机器学习是基于“贴标签”呢?
- 追答
-
你好,如果题目中有明确说到分类的结果,那么数据就是打过标签的。比如贷款分成违约和不违约,债券分成不同的评级,这些都属于分类的目标是明确的。
但如果他只说要分类,但是要分成什么并不知道,那么就是没打过标签的数据。
- 追问
-
谢谢老师。只是这里说基于财务和非财务特征,不是和违约和不违约同理,是标签的一种吗?我还是没完全弄懂😂
- 追答
-
违约不违约是分类的结果。
基于财务和非财务特征是分类的方法,但是基于财务和非财务特征可以分出什么类别出来,题目没说。
- 追问
-
谢谢老师。懂了,即分类结果(即类别)才能作为标签?
- 追答
-
这么说有些不太准确,应该说有特定的分类目标和结果,说明数据是打过标签的。
因为有些题目会明确的说数据是labeled date或是unlabeled data,那么很容易区分是监督还是非监督学习。
但是有些题目不会说是不是打过标签的数据,所以可以根据有没有具体的分类目标来判断,用到的数据集是打过标签还是没打过标签的数据,从而判断是监督学习还是非监督学习。
- 追问
-
谢谢老师耐心、专业的答疑,现在明白了。一是根据题目是否明确提及labeled data;而是题目没有明说是否贴标签,但可以根据是否提供分类目标(或结果)作出判断。谢谢。
- 追问
-
不好意思,打错字。不是“而”,是“二”。
- 追答
-
是的,理解正确,加油~
评论
0/1000
追答
0/1000
+上传图片
