課程名稱:Python 實現文本解析器培訓

        4401 人關注
        (78637/99817)
        課程大綱:

        強化學習基礎算法培訓

         

         

        強化學習(英語:Reinforcement learning)是非常前沿的學科,

        它可能是實現強(類)人工智能的手段之一。

        了解并掌握基礎的強化學習方法,

        將使得你對人工智能的概念進一步深化。

        1 強化學習概念

        2 Sarsa 強化學習算法

        3 OpenAI Gym 應用

        4 Q-Learning 強化學習算法

        5 策略梯度算法

        1
        強化學習介紹與示例

        1.強化學習介紹

        2.強化學習算法分類

        3.強化學習應用

        4.課外內容推薦

        2
        Q-Learning 強化學習方法實現

        1.QTable的概念

        2.QLearning算法實現

        3.Sarsa學習算法

        4.Sarsa和QLearning區別

        挑戰 1
        實現 Sarsa 學習算法走出迷宮

        1.QTable初始化

        2.QTable更新函數

        3.Sarsa完整算法實現

        3
        OpenAI Gym 環境介紹及使用

        1.Gym環境安裝

        2.Gym環境使用

        3.Gym環境示例

        2
        Gym 玩 Atari 打磚塊游戲

        1.OpenAIGym使用

        2.打磚塊游戲可視化

        4
        策略梯度強化學習方法實現

        1.策略梯度過程推導

        2.策略梯度定理

        3.蒙特卡洛策略梯度算法

        4.ActorCritic策略梯度算法

        5.策略梯度算法實現

        3
        使用策略梯度訓練 CartPole

        1.策略梯度

        2.策略梯度定理

        3.MonteCarlo策略梯度算法

        4.ActorCritic策略梯度


        登錄 后發表評論
        新評論
        全部 第1節 第2節 第3節 第4節 第5節 第6節 第7節 第8節 第9節 第10節 第11節 第12節 第13節 第14節 第15節 第16節 第17節
        我的報告 / 所有報告