Phyllis2021-03-25 21:13:09
老师 机器学习的神经网络中的 强化学习(RL)是否是基于立即反馈的呢?是unlabled的吧 所以感觉是不能得到反馈的 但也不是很确定
回答(1)
Kevin2021-03-26 09:39:00
同学你好!
1.是立即反馈的。
2.广义上来说,强化学习和监督式学习、非监督式学习都不一样,但一定是不带标签的。
致正在努力的你,望能解答你的疑惑~
如此次答疑能更好地帮助你理解该知识点,烦请【点赞】。你的反馈是我们进步的动力,祝你顺利通过考试~
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
