老师机器学习的神经网络中的强化学习（RL）是否是基于立即反馈的呢？是unlabled的吧所以感觉是不能得到反馈的但也不是很确定



你还未登录〜

听歌而来，送我踏青云〜

您现在的坐在位置：首页>智汇问答>CFA问答

回答（1）

同学你好！

1.是立即反馈的。

2.广义上来说，强化学习和监督式学习、非监督式学习都不一样，但一定是不带标签的。

致正在努力的你，望能解答你的疑惑~
如此次答疑能更好地帮助你理解该知识点，烦请【点赞】。你的反馈是我们进步的动力，祝你顺利通过考试~

0/1000

0/1000

+上传图片

登录金程网校

󰀂用户名或密码不匹配，请重新输入

两周内免登录

忘记密码？

直接登录：

注册金程账号

注册金程网校

同意金程的《用户协议》

直接登录：

已有账号登录