老师，原版书课后题第33页第3题，请问为什么不能选择C，而是选择A呢？步骤2中提到“based on a wide variety of the most relevant financial and non-financial characteristic”是贴标签的意思吗？谢谢。



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>CFA二级

-2023-02-24 22:28:26

老师，原版书课后题第33页第3题，请问为什么不能选择C，而是选择A呢？步骤2中提到“based on a wide variety of the most relevant financial and non-financial characteristic”是贴标签的意思吗？谢谢。

回答（1）

最佳

Essie2023-02-25 14:46:02

你好，based on a wide variety of the most relevant financial and non-financial characteristic不是贴标签的意思，这句话描述的不是数据本身的类型，而是指机器学习用来分类的方法，它说“基于各种财务相关和非财务的特征”将10000只股票分为20个group，但是具体这20类是根据什么指标进行分类，分出来是什么结果，我们并不知道，题目中也没有说明，所以这是非监督学习。三个选项中只有A是非监督学习的方法，所以选择K均值聚类。
如果题目说它用的是可视化的算法，将股票分为IPO目标和非IPO目标，或分成了成长股和价值股，这种情况才选CART。
PS: 麻烦下次同学下次说LM6的第三题，因为你说的原版书页数好像不太对，这个是原版书的第268页，不是33页，这样不太好定位题目，谢谢啦～

评论（0）
追问（9）

追问

谢谢老师。好的，我下次注意表明LM几哈。另外，请问一般case中，哪些词或字眼表示对应的机器学习是基于“贴标签”呢？

追答

你好，如果题目中有明确说到分类的结果，那么数据就是打过标签的。比如贷款分成违约和不违约，债券分成不同的评级，这些都属于分类的目标是明确的。但如果他只说要分类，但是要分成什么并不知道，那么就是没打过标签的数据。

追问

谢谢老师。只是这里说基于财务和非财务特征，不是和违约和不违约同理，是标签的一种吗？我还是没完全弄懂😂

追答

违约不违约是分类的结果。基于财务和非财务特征是分类的方法，但是基于财务和非财务特征可以分出什么类别出来，题目没说。

追问

谢谢老师。懂了，即分类结果（即类别）才能作为标签？

追答

这么说有些不太准确，应该说有特定的分类目标和结果，说明数据是打过标签的。因为有些题目会明确的说数据是labeled date或是unlabeled data，那么很容易区分是监督还是非监督学习。但是有些题目不会说是不是打过标签的数据，所以可以根据有没有具体的分类目标来判断，用到的数据集是打过标签还是没打过标签的数据，从而判断是监督学习还是非监督学习。

追问

谢谢老师耐心、专业的答疑，现在明白了。一是根据题目是否明确提及labeled data；而是题目没有明说是否贴标签，但可以根据是否提供分类目标（或结果）作出判断。谢谢。

追问

不好意思，打错字。不是“而”，是“二”。

追答

是的，理解正确，加油～