天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA问答

Phyllis2021-03-25 21:13:09

老师 机器学习的神经网络中的 强化学习(RL)是否是基于立即反馈的呢?是unlabled的吧 所以感觉是不能得到反馈的 但也不是很确定

回答(1)

Kevin2021-03-26 09:39:00

同学你好!

1.是立即反馈的。

2.广义上来说,强化学习和监督式学习、非监督式学习都不一样,但一定是不带标签的。


致正在努力的你,望能解答你的疑惑~
如此次答疑能更好地帮助你理解该知识点,烦请【点赞】。你的反馈是我们进步的动力,祝你顺利通过考试~ 

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录