周同学2025-02-05 20:48:41
这里书上写的Yj=1,或是该项目成功,是否应该写成F(y)=1,Yj是横轴,F(y)才是纵轴
回答(1)
黄石2025-02-06 11:05:47
同学你好。Logistic regression考虑的是Y为伯努利变量的情景,即Y的取值非0即1。通常称Y = 1的情况为´success´。比方说你可以定义Y = 1为违约、Y = 0为不违约。对应的模型中的X变量就可以是一些能够衡量信用质量的指标。
之所以在此情景下使用logistic regression,逻辑如下:若Y的取值非0即1,那么E[Y] = Pr(Y = 1)*1 + Pr(Y = 0)*0 = Pr(Y = 1),而E[Y|X] = Pr(Y = 1|X)。又因为回归本身就是基于X的取值对Y做预期,所以E[Y|X] = a + b1X1 + b2X2 + ... + bmXm。然而,由于E[Y|X]本身就等于一个概率,其取值是有范围限定的(0 - 1之间),所以单凭估计一条回归线不太好处理这里的问题。对此的解决方案是,在回归线的基础上引入一个取值范围在0 - 1之间的函数f,将E[Y|X] = Pr(Y = 1|X)写作f(a + b1X1 + b2X2 + ... + bmXm),这样就能解决此处的问题。常用的函数f包括标准正态分布的CDF(使用该CDF的模型叫做probit regression)与逻辑斯蒂分布的CDF(使用该CDF的模型叫做logistic/logit regression)。课件上的F(y)即逻辑斯蒂分布的CDF。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片