第一部份:某企業級大數據應用服務架構演進
1)大數據在企業中的主要應用
2)業務快速迭代背景下對技術的挑戰
3)企業級大數據應用服務整體介紹
第二部份:大數據服務高可用設計原則
1)多維度切入高可用架構設計理念
2)可用性評價維度介紹
3)資源隔離保護核心服務
4)流量控制打造柔性可用系統
5)分鐘級定位故障以及糾錯方案
6)兜底以及回滾、降級減少故障恢復時間
7)常態化的故障演練機制以及容災方案
第三部份:基于MySQL集群構建可伸縮性存儲層
1)數據量以及請求量對查詢服務的沖擊
2)可伸縮的應對上下游壓力的實踐
3)讀寫分離下MySQL的高可用設計
第四部份:基于HBase的支撐百億級別數據查詢(1)
1)hbase入門
2)hbase簡單操作
3)hbase架構詳解(what and why)
第五部份:基于hbase的支撐百億級別數據查詢(2)
1)hbase核心源碼深度剖析
2)hbase優劣勢以及技術選型
3)hbase企業級典型應用場景以及較佳實踐
第六部份:企業級大數據OLAP介紹
1)OLAP是什么以及常見操作
2)OLAP引擎技術方案選型
第七部份:Kylin離線大數據OLAP引擎解決方案
1)Kylin介紹
2)海量數據較精確去重的實現
3)Kylin的優勢以及局限
4)Apache Kylin的應用場景和較佳實踐
第八部份:Druid實時大數據分析引擎
1)Druid介紹
2)Druid原理深度剖析
3)Druid應用場景和較佳實踐
第九部份:大數據查詢服務 統一SQL引擎層
1)為什么需要SQL接口層
2)SQL接口層的技術方案選型
3)基于apache calcite實現標準SQL查詢
第十部份:深度挖掘企業大數據價值
1)企業大數據指標體系以及管理策略
2)我們需要收集哪些數據
3)企業大數據應用的痛點
4)討論一下機器學習的問題域
5)算法工程師們都在做些什么
第十一部份:機器學習算法入門
1)機器學習入門 — 什么是機器學習
2)線性回歸算法由淺入深— 麻雀雖小、五臟俱全
3)手把手完成線性擬合數據集實戰
第十二部份:用戶畫像應用介紹
1)比你更了解你,淺談用戶畫像
2)用戶畫像與個性化推薦系統領域
3)用戶畫像效果實時在線評估策略
第十三部份:競價廣告系統點擊率預測算法與實戰
1)線性模型logistic回歸算法介紹
2)基于線性模型logistic回歸的點擊率預測實戰
3)非線性模型GBDT算法介紹
4)非線性模型GBDT與推薦排序
5)基于AUC值、ROC曲線的模型評價方法 |