强化学习建模之前必须思考的问题

19

05

强化学习建模之前必须思考的问题

688 0 0

作者:郁郁园中柳

测试2

强化学习是智能体与环境的交互，通过交互信息来感知环境，从而调整自己的行为，选择出最好的结果。
【相当于人做了多次的探索，把最后的劳动成果以状态值函数、动作状态对值函数等方式表达出来。对人学习过程的简单模拟】

需要思考的问题：
研究什么问题，与环境中的什么东西相关？
哪些行为可以影响到环境，是不是可选的动作？
与环境的交互是为了什么？要达成什么目标？对每个状态的奖励如何设置？

分别对应环境状态、状态下对应的动作、动作与状态转移的关系、对目标的设定及衡量

在目前你考虑的问题中是否对一些情况作了理想化处理？如果不做理想化处理应该选择什么方式来解决这个问题？

【个人理解：强化学习很像自己指定规则来探索环境，根据规则尝试很多次，把最后收敛的结果输出来指导决策】

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/yuyuanliu/p/14780189.html

标签： AI 人工智能

你还没有登录，请先登录或注册！

还没有人评论，欢迎说说您的想法！

相关课程

英特尔® OpenVINO™工具套件初级课程

293080

英特尔 OpenCV 初级认证课程

7733

基于 OpenVINO™ 的 AI 视觉应用进阶课

42051

热门标签

人工智能深度学习 TensorFlow AI

官方群

服务时间：

https://imgs.itxueyuan.com/advPicture/adv-1662379508-4007-pic.jpeg