第一部份:Spark Streamin深度源碼剖析(上)
(1)Spark Streaming整體架構剖析
(2)基于Receiver+Kafka接收數據的源碼剖析
(3)基于DStream生成RDD的源碼剖析
(4)基于JobGenerator生成Job的源碼剖析
第二部份:Spark Streaming深度源碼剖析(下)
(1)Spark Streaming Driver容錯的源碼剖析
(2)Spark Streaming Executor容錯的源碼剖析
(3)Spark Streaming State相關操作的源碼剖析
(4)Spark Streaming Window相關操作的源碼剖析
第三部份:互聯網公司用戶流量實時大盤實戰
(1)互聯網用戶流量分析業務介紹
(2)互聯網用戶流量分析架構設計:Spark Streaming+Kafka+HBase
(3)完成互聯網用戶流量指標體系的開發
(4)實時計算作業上線運維:部署、代碼升級以及監控
(5)對Spark Streaming作業進行初步的性能優化
(6)基于前端展示用戶流量分析大盤
第四部份:廣告系統實時數據平臺架構實戰(上)
(1)廣告系統實時數據平臺的業務介紹以及架構設計
(2)完成廣告用戶與客戶價值的實時數據指標體系開發
(3)完成廣告運營與營銷活動的實時數據指標體系開發
(4)基于廣告實時數據支持的點擊率預測
(5)基于廣告實時數據支持的精準廣告營銷
第五部份:廣告系統實時數據平臺架構實戰(下)
(1)廣告系統實時數據平臺架構優化設計
(2)基于Spark Streaming checkpoint實現全流程的容錯機制
(3)基于Spark Streaming實現全流程的exatcly once語義
(4)基于Kafka實現數據不丟失的技術方案
(5)基于前端頁面展示廣告數據分析
第六部份:微博熱點話題實時探測系統架構實戰(上)
(1)微博熱點話題探測業務介紹
(2)微博熱點話題探測系統架構設計
(3)基于Flume+Kafka完成實時微博數據的接入
(4)自己動手改進FP-Growth頻繁集挖掘算法
(5)基于改進后的繁集挖掘算法完成熱點話題的實時探測
第七部份:微博熱點話題實時探測系統架構實戰(下)
(1)基于Spark自己動手實現word2vec算法
(2)基于自己實現的Spark word2vec算法實現關聯熱點話題挖掘
(3)基于Spark Streaming完成實時計算作業開發
(4)基于前端頁面展示微博熱點話題
第八部份:微博社交關系實時挖掘平臺實戰(上)
(1)微博社交關系實時數據分析平臺業務介紹以及架構設計
(2)Titan分布式圖數據庫介紹
(3)Cassandra分布式NoSQL數據庫介紹
(4)Elasticsearch分布式搜索引擎介紹
(5)基于Spark Streaming+GraphX+Titan完成微博社交關系挖掘
第九部份:微博社交關系實時挖掘平臺實戰(下)
(1)基于Spark Streaming+文本挖掘完成微博用戶的情感分析
(2)基于Spark Streaming完成微博用戶群分析
(3)基于Spark Streaming完成用戶城市地圖分析
(4)基于Spark Streaming完成熱門話題趨勢分析
(5)基于前端頁面展示微博社交數據
第十部份:股票交易分析實時大盤系統實戰
(1)股票分析業務介紹
(2)實時股票分析大盤系統架構設計
(3)Druid分布式OLAP引擎介紹
(4)結合Spark Streaming + Druid完成股票數據實時分析
(5)結合Spark Streaming完成實時熱門股票排行
(6)結合Spark Streaming完成實時股票走勢預測
(7)基于前端頁面展示股票分析數據
第十一部份:實時用戶畫像系統架構實戰
(1)實時用戶畫像組成分析
(2)實時用戶畫像的標簽數據字典
(3)實時用戶畫像的興趣度模型
(4)基于Spark Streaming實現一套實時用戶畫像系統
(5)基于ElasticSearch對實時用戶畫像數據進行分析
第十二部份:實時個性化推薦系統架構實戰(上)
(1)基于Flume+Kafka實現用戶行為的實時采集與清洗
(2)基于實時用戶畫像構建數據倉庫
(3)針對元數據庫構建實時索引
(4)基于Spark Streaming完成第一個版實時個性化推薦系統
第十三部份:實時個性化推薦系統架構實戰(下)
(1)基于頻繁模式的選擇性集成分類算法
(2)基于選擇性集成分類算法和網頁對用戶進行分類以及興趣組構建
(3)基于Spark Streaming+協同過濾算法實現的實時推薦系統
(4)基于相關性算法實現的實時個性化推薦冷啟動優化方案
|