
強化學習基礎算法培訓
強化學習(英語:Reinforcement learning)是非常前沿的學科,
它可能是實現強(類)人工智能的手段之一。
了解并掌握基礎的強化學習方法,
將使得你對人工智能的概念進一步深化。
1 強化學習概念
2 Sarsa 強化學習算法
3 OpenAI Gym 應用
4 Q-Learning 強化學習算法
5 策略梯度算法
1
強化學習介紹與示例
1.強化學習介紹
2.強化學習算法分類
3.強化學習應用
4.課外內容推薦
2
Q-Learning 強化學習方法實現
1.QTable的概念
2.QLearning算法實現
3.Sarsa學習算法
4.Sarsa和QLearning區別
挑戰 1
實現 Sarsa 學習算法走出迷宮
1.QTable初始化
2.QTable更新函數
3.Sarsa完整算法實現
3
OpenAI Gym 環境介紹及使用
1.Gym環境安裝
2.Gym環境使用
3.Gym環境示例
2
Gym 玩 Atari 打磚塊游戲
1.OpenAIGym使用
2.打磚塊游戲可視化
4
策略梯度強化學習方法實現
1.策略梯度過程推導
2.策略梯度定理
3.蒙特卡洛策略梯度算法
4.ActorCritic策略梯度算法
5.策略梯度算法實現
3
使用策略梯度訓練 CartPole
1.策略梯度
2.策略梯度定理
3.MonteCarlo策略梯度算法
4.ActorCritic策略梯度
