第一部份 Spark ML基礎入門
1、Spark介紹
2、Spark ML介紹
3、部份程的基礎環(huán)境
4、Spark SparkSession
5、Spark Datasets操作
6、Datasets操作的代碼實操
第二部份 Spark ML Pipelines(ML管道)
1、Pipelines的主要概念
2、Pipelines實例講解
3、ML操作的代碼實操
4、使用 ML Pipeline 構建機器學習工作流案例展示
5、實例的代碼實操
第三部份 Spark ML數(shù)學基礎
1、ML矩陣向量計算
2、分類效果評估指標及ML實現(xiàn)詳解
3、交叉-驗證方法及ML實現(xiàn)詳解
4、實例的代碼實操
第四部份 Spark ML特征的提取、轉換和選擇
1、特征的提取及ML實現(xiàn)詳解
2、特征的轉換及ML實現(xiàn)詳解
3、特征的選擇及ML實現(xiàn)詳解
4、實例的代碼實操
第五部份 Spark ML線性回歸/邏輯回歸算法
1、線性回歸算法
2、邏輯回歸算法
3、ML回歸算法參數(shù)詳解
4、ML實例
5、實例的代碼實操
第六部份 Spark ML決策樹/隨機森林/GBDT算法
1、決策樹算法
2、隨機森林算法
3、GDBT算法
4、ML樹模型參數(shù)詳解
5、ML實例
6、實例的代碼實操
第七部份 Spark ML KMeans聚類算法
1、KMeans聚類算法
2、ML KMeans模型參數(shù)詳解
3、ML實例
4、實例的代碼實操
第八部份 Spark ML LDA主題聚類算法
1、LDA主題聚類算法
2、ML LDA主題聚類模型參數(shù)詳解
3、ML實例
4、實例的代碼實操
第九部份 Spark ML協(xié)同過濾推薦算法
1、協(xié)同過濾推薦算法
2、ML協(xié)同過濾分布式實現(xiàn)邏輯
3、ML協(xié)同過濾源碼開發(fā)
4、實現(xiàn)實例
5、實例的代碼實操
第十部份 大型案例:基于Spark的推薦模型開發(fā)
1、案例背景
2、架構設計
3、數(shù)據(jù)準備
4、模型訓練
5、模型預測
6、腳本封裝 |