
Spark大數據挖掘工具Mllib實戰培訓
第一講 Spark大數據實時處理技術
1)大數據處理技術
2)Spark實時處理技術
3)Spark生態系統BDAS
4)Spark架構分析
第二講 Spark安裝配置及監控
1)Ubuntu環境的準備
2)Hadoop2.X和Scala
3)搭建Spark開發環境
4)Idea編譯和運行
5)Spark監控管理
第3講 Scala編程語言和分布式計算模型
1) Scala編程語言
2) 操作基本數據類型
3)Spark計算模型和RDD
4)Transformation及Actions算子
5)Spark MLlib矩陣向量
第四講 Spark MLlib線性回歸和邏輯回歸算法
1)線性回歸算法
2)線性回歸代碼實例
3)邏輯回歸算法
4)邏輯回歸回歸代碼實例
5)線性回歸和邏輯回歸代碼實操
第五講 Spark MLlib貝葉斯分類算法
1) 貝葉斯分類算法原理
2) Spark貝葉斯分類源碼
3) Spark貝葉斯分類代碼示例
4) 貝葉斯分類代碼實操
第六講 Spark MLlib決策樹算法
1) 決策樹算法原理
2) Spark決策樹算法源碼
3) Spark決策樹算法代碼示例
4) 決策樹代碼實操
第七講 Spark MLlib聚類算法
1) K-Means聚類算法原理
2) Spark K-Means聚類算法源碼
3) SparkK-Means聚類代碼示例
4) 聚類算法代碼實操
第八講 Spark MLlib關聯規則算法
1) FPGrowth關聯規則算法原理
2) FPGrowth關聯規則算法源碼
3) FPGrowth關聯規則代碼示例
4) 關聯規則代碼實操
第九講 Spark MLlib算法
1) 協同過濾算法原理
2) Spark協同過濾源碼
3) Spark協同過濾代碼示例
4) 代碼實操
第十講 Spark MLlib神經網絡算法
1) 神經網絡算法原理
2) Spark神經網絡算法源碼
3) Spark神經網絡代碼示例
4) 神經網絡代碼實操
六、培訓
1, 了解大數據實時處理技術的相關知識。
2,學習Spark的核心技術方法以及應用特征。
3,深入使用MLLib在大數據挖掘和實時分析中的使用。
4,掌握MLlib相關機器學習和數據挖掘工具的使用。