1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽; 2、課程完成后,授課老師留給學員手機和Email,保障培訓效果,免費提供半年的技術支持。 3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,曙海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,曙海的證書受到廣泛認可。 |
Gym是為測試和開發RL算法而設計的環境/任務的集合。它讓用戶不必再創建復雜的環境。Gym用Python編寫,它有很多的環境,比如機器人模擬或Atari 游戲。它還提供了一個在線排行榜,供人們比較結果和代碼。
第1章 強化學習與常用的仿真環境平臺介紹(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2章 OpenAI gym中的常用仿真環境介紹,包括Atari 2600 游戲系列、MuJoCo 物理模擬器、Toy text 文本環境、Robotics機械手與機械臂模擬器等
第3章 馬爾科夫決策過程MDP
第4章 基于gym的MDP實例講解,基于OpenAI Gym構建股票市場交易環境
第5章 基于gym的強化學習實踐:基于值函數的強化學習方法實現;基于策略梯度的強化學習方法實現
第6章 虛擬環境Universe: 一個用于訓練解決通用問題 AI 的基礎架構
第7章 基于Universe的強化學習實踐:用OpenAI公司的Gym工具庫和Universe平臺為游戲創建人工智能機器人 |