掌握大數據領域中的推薦系統
適用人群
有Spark基礎的同學
課程簡介
本課程的目的是使得同學們掌握大數據領域中的推薦系統
課程內容從兩部分講解推薦系統:
第一部分講解的是推薦系統需要的算法及其推導,內容如下:
1、基于內容的推薦系統
2、協同過濾的核心概念
3、基于用戶的協同過濾和基于產品的協同過濾
4、相似度的計算
5、隱語義模型的講解
6、Spark支持的推薦算法的介紹
7、交替小二乘法(ALS)的推導
第二部分講解的是Spark代碼實現的推薦系統,內容如下:
1、隱式類型數據的推薦的實現
2、顯示類型數據的推薦的實現
3、冷啟動問題
4、Spark中ml包和mllib包的比較
第1章Spark中的推薦算法
1-1推薦系統概述
1-2基于內容的推薦算法
1-3CF和核心概念
1-4User-Based_CF和Item-Based_CF
1-5相似度計算
1-6隱語義模
1-7正則化
1-8Spark支持的推薦算法
1-9交替小二乘算法講解
第2章推薦代碼實現
2-1隱式模型vs顯示模型
2-2數據集準備
2-3數據解析
2-4構建第一個模型
2-5模型評估
2-6選擇合理的超參數
2-7顯示類型數據的推薦的實現
2-8交叉驗證
2-9冷啟動問題
2-10Spark中mllib中的ALS的使用
2-11Spark中的ml包和mllib包 |