天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>FRM一级

柠同学2024-07-28 14:24:45

完全看不懂解析,不知道如何下手

查看试题

回答(1)

黄石2024-07-29 11:27:43

同学你好。这道题考察的是reinforcement learning中的Q-learning的具体应用。其实从题目本身来说只要会套这两个公式即可,其中S是state,A是action,alpha是一个参数,叫做learning rate,R是reward,Q_old就是当前的Q值,Q_new是新的Q值(当machine采取了一个action,进入了一个state后的Q值)。对于Q-learning的话通过一个例子来看会更好理解一些,见下图。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录