第一部份:Spark生態和安裝部署
Spark概述
Spark現狀
安裝部署
Spark安裝簡介
Spark的源碼編譯
Spark Standalone安裝
Spark Standalone HA安裝
Spark工具
Spark交互式工具spark-shell
Spark應用程序部署工具spark-submit
第二部份:Spark編程模型和解析
Spark的編程模型
RDD的特點、操作、依賴關系
緩存策略
廣播變量和累加器
Spark編程環境搭建
Spark編程實例
第三部份:Spark運行架構和解析
Spark的運行架構
基本術語
運行架構(DAGScheduler、TaskSeduler、Task、容錯性、推測機制、數據本地性)
Spark on Standalone運行過程
Spark on YARN 運行過程
第四部份:hive入門
hive的運行架構
hive的安裝
hive的實例演示
第五部份:SparkSQL原理和實踐
Spark的運行架構
Catalyst
sqlontext
hiveContext
ThriftServer和CLI
ThriftServer
CLI
SparkSQL的實例演示和編程
spark-shell實例演示
spark-sql實例演示
SparkSQL的編程
第六部份:SparkStreaming原理和實踐
SparkStreaming原理
SparkStreaming的原理
SparkStreaming的運行方式
DStream的特點和操作
SparkStreaming實例演示
網絡數據演示
文本實例演示
Window操作演示
第七部份:MLlib入門
什么是機器學習
MLlib的架構
Mllib實例演示
聚類算法演示
推薦系統演示
第八部份:GraphX入門
圖論基礎
GraphX的架構
GraphX實例演示
圖的基本操作
PageRank演示
第九部份:Spark運維
Spark On YARN
history server
job server
Spark的監控
Spark UI監控
第十部份:Scala on Spark
spark常用的scala基礎
如何閱讀spark源代碼
如何構建spark項目
第十一部份:Spark編程
RDD的編程
Spark綜合實例(SparkSQL+sparkMlib+R)
第十二部份:Spark源碼研讀
Spark源碼總體介紹
SparkCore源碼細解
Spark Examples介紹
第十三部份:雜談
Spark相關項目
BlinkDB簡介
SparkR的安裝和實例
Techyon