回答(1)
最佳
Michael2025-07-12 20:35:46
同学你好,model specification error表示的是模型在假设中的错误,这个题目中的B和C比较容易理解,都是假设(assuming)中的问题,然后A选项其实是遗漏重要变量偏差(也是违背回归模型假设的常见情况)。
- 评论(0)
- 追问(2)
- 追问
-
那calibration error除了D选项说的还有什么?可以举几个例子吗?
- 追答
-
同学你好,首先要说明校准误差这个并不在考试大纲的学习要求中,因为这个部分涉及到一些机器学习的内容,已经放在了一级数量的考试大纲里面了。下面我简要解释一下。
首先,校准误差的本质是模型预测的概率(如“80%可能性上涨”)与实际发生的频率不一致。在D选项里面,模型校准依赖于训练/验证数据的分布。若数据时间段选择不当(如忽略经济周期、政策变化、突发事件),会导致数据分布失真,也就是样本无法代表模型应用时的真实世界分布(如用牛市数据训练,预测熊市),以及概率估计失效,模型基于历史错误分布预测的概率,无法反映未来实际发生频率。
其次,类似的案例还有很多,我举一些例子
(1) 模型结构导致的系统性偏差
问题:模型本身无法捕捉概率的真实分布规律。比如神经网络模型因过度简化或过拟合,倾向于输出接近0或1的极端概率(也就是非黑即白),导致过度自信。
(2) 类别不平衡(Class Imbalance),这个也是出现最多的
问题:训练数据中少数类样本过少,模型对少数类预测概率失真。
(3) 未校正的模型输出
问题:分类模型(如决策树、SVM)的原始输出并非真实概率,直接使用会导致误差。
(4)数据污染
问题:验证/测试数据被泄露到训练中,或与训练数据重叠。最常见的就是使用“未来数据”,如在时间序列预测中,用“未来数据”验证模型,导致模型在测试集过度自信。


评论
0/1000
追答
0/1000
+上传图片