在线不卡中文字幕播放,亚洲免费观看,91亚洲成人

課程大綱

課程大綱：

強化學習基礎算法培訓

強化學習（英語：Reinforcement learning）是非常前沿的學科，

它可能是實現強（類）人工智能的手段之一。

了解并掌握基礎的強化學習方法，

將使得你對人工智能的概念進一步深化。

1 強化學習概念

2 Sarsa 強化學習算法

3 OpenAI Gym 應用

4 Q-Learning 強化學習算法

5 策略梯度算法

1
強化學習介紹與示例

1.強化學習介紹

2.強化學習算法分類

3.強化學習應用

4.課外內容推薦

2
Q-Learning 強化學習方法實現

1.QTable的概念

2.QLearning算法實現

3.Sarsa學習算法

4.Sarsa和QLearning區別

挑戰 1
實現 Sarsa 學習算法走出迷宮

1.QTable初始化

2.QTable更新函數

3.Sarsa完整算法實現

3
OpenAI Gym 環境介紹及使用

1.Gym環境安裝

2.Gym環境使用

3.Gym環境示例

2
Gym 玩 Atari 打磚塊游戲

1.OpenAIGym使用

2.打磚塊游戲可視化

4
策略梯度強化學習方法實現

1.策略梯度過程推導

2.策略梯度定理

3.蒙特卡洛策略梯度算法

4.ActorCritic策略梯度算法

5.策略梯度算法實現

3
使用策略梯度訓練 CartPole

1.策略梯度

2.策略梯度定理

3.MonteCarlo策略梯度算法

4.ActorCritic策略梯度

請登錄后發表評論

新評論

全部第1節第2節第3節第4節第5節第6節第7節第8節第9節第10節第11節第12節第13節第14節第15節第16節第17節

我的報告 / 所有報告

我要提問

課程名稱：Python 實現文本解析器培訓

課程教師

進階課程

課程名稱：Python 實現文本解析器培訓

課程教師

進階課程

開始新實驗

開始評估課實驗

開始實驗