
機器學習與R語言培訓
一:機器學習基本理論
機器學習概述
機器學習算法分類及知識框架
機器學習相關概念
機器學習一般步驟
案例:用R實現機器學習模型預測
二:R語法基礎
R語言基礎語法
數據處理常用R包介紹(tidyr,dplyr,stringr,reshape2,ggplot2)
數據的存取與編輯
非結構化數據的讀取
案例:用R實現MySQL數據庫數據讀取
三:數據清洗方法
缺失數據處理
異常值的辨識處理
不平衡數據的處理
特征提取與特征工程
案例:針對美國人群收入等數據進行數據清洗
四:線性回歸與Logistic回歸
線性回歸與小二乘法
Lasso回歸及嶺回歸
Logistic回歸模型
多分類Logistic回歸模型
案例:運用Logistic回歸模型預測學生錄取情況
五:K近鄰(KNN)算法
k近鄰算法原理
k近鄰算法R實現
案例:運用KNN實現前列腺癌癥檢測
六:聚類算法
聚類算法原理
聚類算法R實現
案例:運用聚類分析進行離群點識別
七:基于決策樹類型算法介紹
決策樹算法
隨機森林算法
八:提升算法
Adaboost算法
GBDT算法
XGBoost
案例:針對美國人群收入預測模型比較
九:SVM支持向量機算法介紹
SVM基本原理
SVM算法的R實現
十:人工神經網絡
人工神經網絡(RNN)
深度學習
案例:運用神經網絡實現手寫數字識別
十一:地圖可視化:上海交通地圖數據可視化實戰
數據可視化基本圖形選擇匯總
繪制數據地圖常用方法
交互式可視化實戰
十二:機器學習mlr包:債務預測實戰
mlr包介紹
實際問題分析及數據處理
多種分類算法模型的比較