
機器學習及Python應用培訓
第1講 機器學習引論
(1) 什么是機器學習
(2) 機器學習的分類與術語
(3) 案例:垃圾郵件過濾;手寫體數字識別;圖像識別;自動駕駛
第2講 Python語言快速入門
(1) Why Python?
(2) 安裝Python與Spyder
(3) Python的模塊 (module)
(4) Python的對象 (str, bool, list, tuple, dict, set)
(5) Python的函數 (function)與方法 (method)
(6) Numpy (ndarray), pandas (Series, DataFrame)
(7) sklearn (機器學習)與keras (深度學習)
(8) Python畫圖 (Matplotlib, pandas, seaborn)
(9) Python面向對象編程
第3講 數學回顧
(1) 梯度向量
(2) 方向導數
(3) 梯度下降
(4) 向量微分
(5) 優化
第4講 線性回歸
(1) OLS
(2) 過擬合與泛化能力
(3) 偏差與方差的權衡
(4) 交叉驗證
(5) Python案例:多項式回歸的過擬合;波士頓房價
第5講 邏輯 回歸
(1) Logit
(2) 幾率比
(3) 靈敏度與特異度
(4) ROC與A U C
(5) 科恩的kappa
(6) Python案例:泰坦尼克號旅客的存活
第6講 多項邏輯 回歸
(1) 多項Logit
(2) Python案例:識別玻璃類別
第7講 判別分析
(1) 線性判別分析 (Linear Discriminant Analysis)
(2) 二次判別分析 (Quadratic Discriminant Analysis)
(3) 費雪判別分析 (Fisher Discriminant Analysis)
(4) Python案例:鳶尾花品種的歸類
第8講 樸素貝葉斯
(1) 樸素貝葉斯 (Naive Bayes)
(2) 拉普拉斯修正 (Laplacian Correction)
(3) Python案例:垃圾郵件的識別
第9講 懲罰回歸
(1) 高維回歸的挑戰
(2) 嶺回歸 (Ridge Regression)
(3) 套索估計 (Lasso)
(4) 彈性網估計 (Elastic Net)
(3) Python案例:前列腺癌的影響因素
第10講 K近鄰法
(1) 回歸問題的K近鄰法
(2) 分類問題的K近鄰法
(3) Python案例:摩托車撞擊實驗數據;鳶尾花品種的歸類;威斯康辛乳腺癌的診斷
第11講 決策樹
(1) 分類樹 (Classification Tree)
(2) 分裂準則(錯分率、基尼指數、信息熵)
(3) 成本復雜性修枝
(4) 回歸樹 (Regression Tree)
(5) Python案例:波士頓房價;葡萄牙銀行市場營銷
第12講 隨機森林
(1) 集成學習 (Ensemble Learning)
(2) 裝袋法 (Bagging)
(3) 隨機森林 (Random Forest)
(4) 變量重要性 (Variable Importance)
(5) 偏依賴圖 (Partial Dependence Plot)
(6) Python案例:波士頓房價;聲吶信號的分類
第13講 提升法
(1) 自適應提升法 (AdaBoost)
(2) AdaBoost的統計解釋
(3) 梯度提升法 (Gradient Boosting Machine)
(4) XGBoost算法
(5) Python案例:波士頓房價;過濾垃圾郵件;識別玻璃類別
第14講 支持向量機
(1) 大間隔分類器 (Maximal Margin Classifier)
(2) 軟間隔分類器 (Soft MarginClassifier)
(3) 支持向量機 (Support Vector Machine)
(4) 核技巧 (Kernel Trick)
(5) 支持向量回歸 (Support Vector Regression)
(6) Python案例:模擬數據;過濾垃圾郵件;識別手寫數字;波士頓房價
第15講 人工神經網絡
(1) 人工神經網絡的思想
(2) 感知機(Perceptron)
(3)前饋神經網絡 (Feedforward Neural Network)
(4) 激活函數 (Activation Function)
(5) 反向傳播算法 (Back-propagation Algorithm)
(6) 隨機梯度下降 (Stochastic Gradient Descent)
(7) 神經網絡的過擬合與正則化
(8) 卷積神經網絡 (Convolution Neural Network)
(9) 深度學習的發展
(10) Python案例 (sklearn與Keras):波士頓房價;過濾垃圾郵件;模擬數據;路透社新聞主題分類,手寫數字數據集MNIST
第16講 非監督學習之主成分分析
(1) 總體中的主成分分析
(2) 樣本中的主成分分析
(3) 方差分解與降維
(4) 主成分回歸 (Principal Component Regression)
(5) Python案例:左右耳聽力;香港回歸的經濟效應
第17講 非監督學習之聚類分析
(1) K-均值聚類 (K-meansClustering)
(2) 分層聚類 (Hierarchical Clustering)
(3) 樹狀圖
(4) 基于相關系數的距離
(5) Python案例:模擬數據;鳶尾花品種的歸類
第18講 數據科學的Python語言
(1) 何為數據科學
(2) 讀寫文件
(3) 缺失與重復數據
(4) 合并數據
(5) sklearn的管線類 (pipeline class)
(6) Python案例:Kaggle泰坦尼克數據的清理
第19講(Bonus Lecture) 機器學習在經管社科的應用
精讀幾篇在經管社科頂刊發表的經典機器學習論文