夏同学2019-10-23 00:25:12
老师,在 big data基础班讲义里有讲logisitic regression处理的是small and linear datasets,tree处理的是large and nonlinear datasets,这个和这里讲的有什么区别呢,为什么结论是反的呢?
回答(1)
Robin Ma2019-10-23 17:13:53
同学你好,这个题目问你的是什么是错误的,对于缺失的数据,我们并没有规定一定要使用tree去做处理,如果确实的数据和现有的数据之间呈现的是一个线性的关系的话,regression也是一个很好的办法,B说了太绝对了。 在基础班中,我们从泰坦尼克的案列里面学到的是 对于小样本数据,反而是逻辑回归做了更好,对于大样本的已有数据的分析,是tress做了更好, 这个并不是一定成立的结果,因为增加样本也可以使得回归做了更好,同样地,如果数据本身就是线性的,tress反而会分析了不好,因此在这个题目中,B的说法太过于绝对了,如果是有大量的数据而且关系不是明显线性的话,tre
可能更加好,但是对于缺失数据的处理并没有必要使用tree对所有的数据做决策分析,因为会被举出很多反例,而泰坦尼克的案列是基于板上钉钉的数据,不容易被举出反例或者反例很少。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片