什么是深度强化学习?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

在 上一支视频中 我们提到过,强化学习中的主体会依据环境采取行动,使用神经网络构建强化学习主体的方法,就是深度强化学习。


游戏、机械臂、自动驾驶,强化学习面对的情景多种多样,环境、行为、回报很难穷尽。但只要有输入就一定会有输出,神经网络面对没有见过的情况也能做出选择,这就是我们使用深度强化学习的原因。

随意打赏

提交建议
微信扫一扫,分享给好友吧。