首页
找课程
精选课程
班级课程
会员课程
解决方案
企业合作
高校公益
厂商专区
企培版
首页
找课程
精选课程
班级课程
会员课程
解决方案
企业合作
高校公益
厂商专区
企培版
登录
注册
登录
注册
人工智能强化学习
第20-1任务: Gym 基础实验
查看课程
任务列表
第1-1任务: 强化学习介绍
第1-2任务: text_book.pdf
第2任务: 井子棋游戏实验
第3任务: 值函数与多臂赌徒
第4任务: 多臂赌徒实验
第5任务: 有限马尔可夫决策过程
第6任务: 格子游戏实验
第7任务: 动态规划
第8任务: 动态规划实验
第9任务: 蒙特卡罗方法
第10任务: 黑杰克(21点)游戏实验
第11任务: 时间差分方法
第12任务: 攀登者游戏实验
第13任务: 多时间步差分学习方法
第14任务: 随机行走环境编写与出租车项目挑战
第15任务: 基于格子方法的规划与学习
第16任务: 静态与动态迷宫实验
第17任务: 近似在线策略计算
第18任务: Pytorch 实验
第19任务: 值近似在线策略控制
第20-1任务: Gym 基础实验
第20-2任务: 20 课实验.rar
第21任务: 并行策略的值估计
第22-1任务: DQN论文详解
第22-2任务: 22 课实验.rar
第23任务: 实战太空侵略者
第24-1任务: 实战DOOM
第24-2任务: 24 课实验.rar
第25任务: 对决DQN网络
第26任务: 带优先级的记忆回放技术
第27-1任务: DQN FLappy Bird
第27-2任务: 27 课实验.rar
第28任务: Double DQN
第29-1任务: 对决网络勇闯死亡回廊
第29-2任务: 29 课实验.rar
第30任务: 轨迹跟踪方法
第31任务: 策略梯度方法
第32-1任务: 蒙特卡洛增强算法实验
第32-2任务: 32 课实验.rar
第33-1任务: 单步Actor-Critic算法实验
第33-2任务: 33 课实验.rar
第34-1任务: DOOM生存场景实验(一)
第34-2任务: 34 课实验.rar
第35-1任务: DOOM生存场景实验(二)
第35-2任务: 35 课实验.rar
第36任务: A3C算法理论
第37任务: A3C实验
第38任务: OpenAI Baselines
第39任务: Baselines扩展
第40任务: 自定义游戏环境工具
第41任务: 强化学习实际应用(1)
第42任务: 强化学习实际应用(2)
第43任务: 强化学习实际应用(3)
第44任务: 强化学习实际应用(4)
第45任务: 课程结尾