模塊一?Spark ML基礎入門
1.1 Spark介紹
1.2 Spark ML介紹
1.3 課程的基礎環境
1.4 Spark SparkSession
1.5 Spark Datasets操作
1.6 Datasets操作的代碼實操
模塊二?Spark ML
Pipelines(ML管道)
2.1 Pipelines的主要概念
2.2 Pipelines實例講解
2.3 ML操作的代碼實操
2.4 使用 ML Pipeline 構建機器學習工作流案例展示
2.5 實例的代碼實操聲
模塊三?Spark ML數學基礎
3.1 ML矩陣向量計算
3.2 分類效果評估指標及ML實現詳解
3.3 交叉-驗證方法及ML實現詳解
3.4 實例的代碼實操
3.5 特征的提取及ML實現詳解
3.6特征的轉換及ML實現詳解
3.7 特征的選擇及ML實現詳解
3.8 實例的代碼實操?
模塊四?Spark ML特征的提取、轉換和選擇
4.1 線性回歸算法
4.2 邏輯回歸算法
4.3 ML回歸算法參數詳解
4.4 ML實例
4.5 實例的代碼實操
模塊五?Spark ML線性回歸/邏輯回歸算法
5.1 決策樹算法
5.2 隨機森林算法
5.3 GDBT算法
5.4 ML樹模型參數詳解
5.5 ML實例
5.6 實例的代碼實操
模塊六?Spark ML決策樹/隨機森林/GBDT算法
6.1 KMeans聚類算法
6.2 ML KMeans模型參數詳解
6.3 ML實例
6.4 實例的代碼實操
模塊七?Spark ML KMeans聚類算法?7.1 LDA主題聚類算法
7.2 ML LDA主題聚類模型參數詳解
7.3 ML實例
7.4 實例的代碼實操
模塊八?Spark ML LDA主題聚類算法
8.1 協同過濾推薦算法
8.2 ML協同過濾分布式實現邏輯
8.3 ML協同過濾源碼開發
8.4 實現實例
8.5 實例的代碼實操
模塊九?Spark ML協同過濾推薦算法
9.1 案例背景
9.2 架構設計
9.3 數據準備
9.4 模型訓練
9.5 模型預測
9.6 腳本封裝
模塊十?項目實踐
大型案例:基于Spark的推薦模型開發 |