
大數據技術原理與應用培訓
第1章 大數據概述
1.1大數據時代
1.2大數據的概念和影響
1.3大數據的應用
1.4大數據的關鍵技術
1.5 大數據與云計算、物聯網的關系
第1章 大數據概述 單元測驗
第2章 大數據處理架構Hadoop
2.1Hadoop簡介和版本演變
2.2Hadoop項目結構
2.3Linux和Hadoop的安裝
2.4Hadoop集群的部署和使用
第2章 大數據處理架構Hadoop 單元測驗
第3章 分布式文件系統HDFS
3.1 分布式文件系統HDFS簡介
3.2 HDFS相關概念
3.3 HDFS體系結構
3.4 HDFS存儲原理
3.5 HDFS數據讀寫
3.6 HDFS編程實踐
第3章 分布式文件系統HDFS 單元測驗
第4章 分布式數據庫HBase
4.1 HBase簡介
4.2 HBase數據模型
4.3 HBase的實現原理
4.4 HBase運行機制
4.5 HBase應用方案
4.6 HBase的安裝和編程實踐
第4章 分布式數據庫HBase單元測驗
第5章 NoSQL數據庫
5.1 NoSQL數據庫
5.2 NoSQL與關系數據庫的比較
5.3 四大類型NoSQL數據庫
5.4 NoSQL數據庫的理論基石
5.5 從NoSQL到NewSQL數據庫
5.6 文檔數據庫MongoDB
第5章 NoSQL數據庫 單元測驗
第6章 云數據庫
6.1 云數據庫概述
6.2 云數據庫產品
6.3 UMP系統
6.4 Amazon云數據庫
6.5 微軟云數據庫SQL Azure
第6章 云數據庫 單元測驗
第7章 MapReduce
7.1 MapReduce簡介
7.2 MapReduce的體系結構
7.3 MapReduce工作流程概述
7.4 Shuffle過程原理
7.5 MapReduce應用程序執行過程
7.6 實例分析:WordCount
7.7 MapReduce的具體應用
7.8 MapReduce編程實踐
第7章 MapReduce 單元測驗
第8章 Hadoop再探討
8.1 Hadoop的優化與發展
8.2 HDFS HA和HDFS Federation
8.3 YARN
8.4 Hadoop生態系統中具有代表性的功能組件
第8章 Hadoop再探討 單元測驗
第9章 數據倉庫Hive
9.1 數據倉庫概念
9.2 Hive簡介
9.3 SQL語句轉換成MapReduce作業的基本原理
9.4 Impala
9.5 Hive的安裝和基本操作
第9章 數據倉庫Hive 單元測驗
第10章 Spark
10.1 Spark簡介
10.2 Spark生態系統
10.3 Spark運行架構
10.4 Spark SQL
10.5 Spark的部署和應用方式
10.6 Spark的安裝和編程實踐
第10章 Spark 單元測驗
第11章 流計算
11.1 流計算概述
11.2 流計算處理流程
11.3 流計算的應用
11.4 開源流計算框架Storm
11.5 Spark Streaming、Samza以及三種流計算框架的比較
11.6 Storm的安裝和編程實踐
第11章 流計算 單元測驗
第12章 Flink
12.1Flink簡介
12.2為什么選擇Flink
12.3Flink應用場景
12.4Flink技術棧、體系架構和編程模型
12.5Flink的安裝和編程實踐
第12章 Flink 單元測驗
第13章 圖計算
13.1 圖計算簡介
13.2 Pregel簡介
13.3 Pregel圖計算模型
13.4 Pregel的C++ API
13.5 Pregel的體系結構
13.6 Pregel的應用實例——單源短路徑
13.7 Hama的安裝和使用
第13章 圖計算 單元測驗
第14章 大數據在不同領域的應用
14.1大數據應用概覽
14.2 大數據在互聯網領域的應用——推薦系統
14.3 基于大數據的綜合健康服務平臺
第14章 大數據在不同領域的應用 單元測驗