
大數(shù)據(jù)實(shí)時(shí)處理-基于Spark的大數(shù)據(jù)實(shí)時(shí)處理及應(yīng)用培訓(xùn)
第一講Spark大數(shù)據(jù)實(shí)時(shí)處理技術(shù)
1)大數(shù)據(jù)處理技術(shù)
2)Spark實(shí)時(shí)處理技術(shù)
3)Spark生態(tài)系統(tǒng)BDAS
4)Spark架構(gòu)分析
第二講 Spark安裝配置及監(jiān)控
1)Ubuntu環(huán)境的準(zhǔn)備
2)Hadoop2.X和Scala
3)搭建Spark開發(fā)環(huán)境
4)Idea編譯和運(yùn)行
5)Spark監(jiān)控管理
第三講 Scala編程語言使用概述
1) Scala編程語言
2) 基本數(shù)據(jù)類型
3) 操作基本數(shù)據(jù)類型
4) 類和對象
5) 組合和繼承
第四講 Spark分布式計(jì)算框架
1)Spark計(jì)算模型
2)彈性分布式數(shù)據(jù)集RDD
3)Spark的數(shù)據(jù)存儲
4)Transformation算子分類及功能
5)Actions算子分類及功能
第五講 Spark內(nèi)部工作機(jī)制詳解
1) Spark底層實(shí)現(xiàn)原理
2) Spark應(yīng)用執(zhí)行機(jī)制
3) Spark調(diào)度與任務(wù)分配模塊
4) FIFO和FAIR調(diào)度算法
第六講 Spark數(shù)據(jù)讀取與存儲
1)Spark的I/O機(jī)制
2)Spark中的數(shù)據(jù)壓縮
3)Spark的數(shù)據(jù)讀取與存儲
4)Spark數(shù)據(jù)讀寫流程
第七講 Spark通信模塊和容錯(cuò)機(jī)制
1)Spark通信模塊
2)通信框架AKKA
3)容錯(cuò)機(jī)制和Lineage依賴
4)檢查點(diǎn)機(jī)制進(jìn)行容錯(cuò)
5)Shuffle過程
第八講SQL On Spark
1) BDAS數(shù)據(jù)分析軟件棧
2) SQL On Spark
3) Spark SQL工具使用
4) Shark工具使用
5) Hive on Spark工具
6) Spark操作HBase中的數(shù)據(jù)
第九講 Spark流數(shù)據(jù)處理工具Streaming
1)流數(shù)據(jù)處理工具Streaming
2) Spark Streaming架構(gòu)
3) Spark Streaming原理
4) Spark Streaming實(shí)例
第十講Spark中的大數(shù)據(jù)挖掘工具M(jìn)Llib
1)大數(shù)據(jù)挖掘工具M(jìn)Llib
2)MLlib的數(shù)據(jù)存儲
3)MLlib中的聚類和分類
4)MLlib算法應(yīng)用實(shí)例
5)利用MLlib進(jìn)行
第十一講 Spark大規(guī)模圖處理工具GraphX
1)大規(guī)模圖處理工具GraphX
2)GraphX的運(yùn)行架構(gòu)
3)GraphX操作使用
4)GraphX使用實(shí)例
第十二講 Spark與其他大數(shù)據(jù)技術(shù)的融合與應(yīng)用
1)與Hadoop/Yarn集群應(yīng)用的協(xié)作
2)與Docker等其它云工具配合
3)Spark在Yahoo!的應(yīng)用
4)Spark在電商中的應(yīng)用
六、培訓(xùn)
1,了解大數(shù)據(jù)實(shí)時(shí)處理技術(shù)的相關(guān)知識。
2,學(xué)習(xí)Spark的核心技術(shù)方法以及應(yīng)用特征。
3,深入使用Spark在大數(shù)據(jù)實(shí)時(shí)處理中的使用。
4,掌握BDAS相關(guān)工具及其主要功能。