1、Hadoop 2.x (一)大數據基礎?
?????
http://edu.51cto.com/course/course_id-6704.html??
2、Hadoop 2.x (二)大數據進階?
??????
http://edu.51cto.com/course/course_id-6705.html??
3、Hadoop 2.x (三) 數據分析引擎:Hive?
??????
http://edu.51cto.com/course/course_id-6706.html??
4、Hadoop 2.x (四)數據分析引擎:Pig?
??????
http://edu.51cto.com/course/course_id-6707.html??
5、Hadoop 2.x(五)? MapReduce實戰案例集錦??
????? http://edu.51cto.com/course/course_id-8288.html??
?
6、Hadoop 2.x(六)? 使用Avro實現序列化?
?????http://edu.51cto.com/course/course_id-8978.html?
7、Hadoop 2.x (七):工作流引擎Oozie?
??????http://edu.51cto.com/course/10353.html?
建議學員從第一門課程開始,逐步學習;并完成相應的實驗,這樣可以更好的理解和掌握Hadoop的體系結構。
第一章 課程概述
(*)課程概述
(*)準備實驗數據
(*)MapReduce基礎知識回顧
第二章 案例一:使用MRUnit進行單元測試
(*)使用MRUnit測試Mapper
(*)使用MRUnit測試Reducer
(*)使用MRUnit測試MapperReducer
第三章 案例二:數據去重
(*)一個列的數據去重
(*)多個列的數據去重
第四章 案例三:數據排序
(*)基本數據類型的排序
(*)一個列的排序
(*)多個列的排序
第五章 案例四:每個部門的平均工資
(*)數據的流動過程
(*)開發Mapper、Reduce程序
(*)測試
第六章 案例五:表的自連接
(*)自連接的數據的流動過程
(*)開發Mapper
(*)開發Reducer
(*)測試程序
第七章 案例六:多表查詢
(*)多表查詢的數據的流動過程
(*)開發Mapper
(*)開發Reducer
(*)測試程序
第八章 案例七:倒排索引
(*)倒排索引的數據的流動過程
(*)開發Mapper
(*)開發Combiner
(*)開發Reducer
(*)測試程序
-
-