介紹
統計學習(統計分析)和機器學習之間的區別
金融和銀行公司采用機器學習技術
不同類型的機器學習
有監督學習 vs 無監督學習
迭代和評估
偏差方差權衡
結合有監督學習和無監督學習(半監督學習)
機器學習語言和工具集
開源 vs 專有系統和軟件
R vs Python vs Matlab
庫和框架
機器學習案例研究
消費者數據和大數據
評估消費者和商業貸款的風險
通過情感分析改善客戶服務
檢測身份欺詐、帳單欺詐和洗錢
R的介紹
安裝RStudio IDE
加載R的包
數據結構
向量(Vector)
因素(Factor)
列表(List)
數據幀
矩陣和陣列
如何加載機器學習數據
數據庫、數據倉庫和流數據
使用Hadoop和Spark進行分布式存儲和處理
從數據庫導入數據
從Excel和CSV導入數據
在有監督學習的情況下對業務決策進行建模
對您的數據進行分類(分類)
使用回歸分析來預測結果
從可用的機器學習算法中選擇
理解決策樹算法
理解隨機森林算法
模型評估
練習
回歸分析
線性回歸
概括和非線性
練習
分類
Bayesian refresher
樸素貝葉斯(Naive Bayes)方法
邏輯回歸
k近鄰算法
練習
實踐:建立一個估計模型
根據客戶類型和歷史來評估貸款風險
評估機器學習算法的性能
交叉驗證和重采樣
Bootstrap aggregation (bagging)
練習
在無監督學習的情況下對業務決策進行建模
樣本數據集不可用時
K均值聚類
無監督學習的挑戰
超越均值(K-means)
貝葉斯(Bayes)網絡和馬爾可夫(Markov)隱藏模型
練習
實踐:建立一個推薦系統
分析過去的客戶行為以改進新的服務產品
擴展您公司的能力
在云中開發模型
借助額外的GPU加速機器學習
運用深度學習神經網絡進行計算機視覺、語音識別和文本分析 |