回答(1)
爱吃草莓的葡萄2023-07-10 09:25:41
同学你好。我们一般将样本数据分为样本内数据(in-sample)和样本外数据(out-sample),其中样本内数据用于建模的,样本外数据是用于验证和预测。例如从当前时点可以往前获得过去五年的某种数据吧,是不是可以将这五年分为前两年和后三年(分法不固定),其中前两年数据用于建模,如果你在这两年数据中使劲挖掘关系,是不是会造成数据挖掘偏差,这就使得挖掘的这种只适合于当前的数据,对其它的数据集可能不适用,那么我们后三年样本外数据进行验证是不是可以检测是不是存在数据挖掘偏差。样本内数据与样本外数据在时间等方面是不是不重叠。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
