Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
Reinforcement Learning 简介
- 什么是强化学习?
- 关键概念:智能体、环境、状态、动作和奖励
- 强化学习中的挑战
探索与利用
- 在RL模型中平衡探索与利用
- 探索策略:epsilon-greedy、softmax等
Q学习与深度Q网络(DQNs)
- Q学习简介
- 使用TensorFlow实现DQNs
- 通过经验回放和目标网络优化Q学习
基于策略的方法
- 策略梯度算法
- REINFORCE算法及其实现
- 演员-评论家方法
使用OpenAI Gym
- 在OpenAI Gym中设置环境
- 在动态环境中模拟智能体
- 评估智能体性能
高级Reinforcement Learning技术
- 多智能体强化学习
- 深度确定性策略梯度(DDPG)
- 近端策略优化(PPO)
部署Reinforcement Learning模型
- 强化学习的实际应用
- 将RL模型集成到生产环境中
总结与下一步
最低要求
- 具备Python编程经验
- 对深度学习和机器学习概念有基本了解
- 了解强化学习中使用的算法和数学概念
受众
- 数据科学家
- 机器学习从业者
- AI研究人员
28 時間: