回答(1)
黄石2024-05-14 10:47:59
同学你好。这个内容比较细,原版书上也基本没怎么讲。总而言之,在ANN中,我们会计算模型输出值与实际值之间的误差,并将该误差从输出层向隐藏层反向传播,直至传播到输入层。在反向传播的过程中,模型会结合优化方法、根据误差调整各参数的值。该过程将会不断迭代、直至收敛。常用的优化方法是gradient descent algorithm,在该算法下,通常会先设置一个目标函数,比如mean squared error(见图1),然后将其对biases和weights求一阶导,然后利用图2中的公式去获得新的参数。图2中的gamma就是learning rate,它影响的是gradient descent algorithm调整的大小(倒三角L就是前面求的导数)。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片