
大數據技術原理與應用項目實戰培訓
1 Spark MLLib
1.1 基于大數據的機器學習
1.2 機器學習庫MLLib概述
1.3 基本數據類型
1.4 機器學習流水線
1.5 特征提取、轉換和選擇
1.6 分類算法
1.7 聚類算法
1.8 協同過濾算法
1.9 模型選擇和超參數調整
1.10 將結果導入到Mysql
2 于Hadoop技術的用戶行為分析案例
2.1 數據預處理
2.2 上傳數據至Hive
2.3 數據分析
2.4 導出分析結果至Mysql
3 基于Spark技術的交易數據分析與回頭客預測案例
3.1 對文本文件形式的原始數據集進行預處理
3.2 把文本文件的數據集導入到數據倉庫HDFS中
3.3 支持向量機SVM分類器預測回頭客分析