Hadoop EDW 數據庫管理員培訓
Hadoop EDW 數據庫管理員培訓
課程目標:
此課程面向公司系統管理員、數據庫管理員,希望轉型的DBA 等。以及對Hadoop感興趣的各類技術人員。通過此課程的培訓,學員可以深入理解Hadoop技術架構,對Hadoop
運作機制有清晰全面的認識,可以獨立規劃及部署生產環境的Hadoop集群,掌握Hadoop基本運維思路和方法,對Hadoop集群進行管理和優化。
目標學員:軟件工程師、高級軟件工程師、數據庫開發人員、互聯網服務后臺開發人員、運維人員????
???
培訓大綱
一、集群安裝和管理?????
?
模塊一、Hadoop的來源和動機
??????
·傳統大規模系統存在的問題
??????
· 對一種新的解決方案的需求
?
模塊二、EasyHadoop安裝和部署準備
??????
·Hadoop系統模塊組件概述
??????
·Hadoop試驗集群的部署結構
??????
·Hadoop 安裝依賴關系
??????
·Hadoop 生產環境的部署結構
?
模塊三、EasyHadoop集群安裝和部署
??????
·Red hat Linux基礎環境搭建 上機實驗
??????
·Hadoop 單機系統版本 安裝配置 上機實驗
??????
·Hadoop 集群系統版本 安裝和啟動配置 上機實驗
??????
·Hadoop 集群異常Debug 方法
??????
·Hadoop 集群簡單測試方法
??????
·使用 Hadoop MapReduce Streaming 快速測試系統
?
模塊四、Hadoop組件詳解???
??????
·Hadoop HDFS 基本結構
??????
·Hadoop HDFS 副本存放策略
??????
·Hadoop NameNode 詳解
??????
·Hadoop SecondaryNameNode 詳解
??????
·Hadoop DataNode 詳解
??????
·Hadoop JobTracker 詳解
??????
·Hadoop TaskTracker 詳解
?
模塊五、EasyHadoop集群配置詳解???
??????
·Hadoop core-site,hdfs-site,mapred-site 配置詳解
??????
·Hadoop 高可用配置方法
二、集群優化和管理?????
?
模塊六、EasyHadoop集群配置:機架感知,開啟壓縮和任務均衡???
???????
·Hadoop 集群安裝和開啟LZO壓縮 上機實驗
???????
·Hadoop 配置集群具備機架感知? 上機實驗
???????
·Hadoop 集群開啟公平任務調度器 上機實驗
???????
·Hadoop 集群開啟能力任務調度器 上機實驗
?
模塊七、Hadoop 集群維護與管理???
???????
·查看集群狀態
???????
·HDFS數據管理
???????
·Mapreduce 任務管理
???????
·HDFS安全模式
???????
·模擬集群Namenode,jobtrack失效
???????
·添加刪除節點
???????
·數據平衡
???????
·文件數據跨集群拷貝
???????
·集群升級
?
模塊八、Hadoop 集群規劃和測試???
???????
·集群規劃(硬件,系統,網絡)
???????
·集群性能測試"
?
模塊九、Hadoop 集群監控和運維???
???????
·使用Ganglia 監控Hadoop集群
???????
·使用Cacti 監控操作系統"
?
模塊十、Hadoop HDFS高可用???
???????
·Hadoop 元數據NFS備份方案
???????
·Hadoop SecondaryNameNode備份方案
???????
·Hadoop CheckpointNode備份方案
???????
·Hadoop BackupNode備份方案
???????
·Hadoop Cloudera HA Namenode 方案
三、EasyHive EasyPig 數據倉庫??????
?
模塊一、EasyHive倉庫集群
??????
·Hive的作用和原理說明
??????
·Hadoop倉庫和傳統數據倉庫的協作關系
??????
·Hadoop/Hive倉庫數據數據流
??????
·Hive 部署和安裝
??????
·Hive Cli 的基本用法
??????
·HQL基本語法
?
模塊二、EasyHive倉庫集群高級
??????
·使用JDBC 連接Hive進行查詢和分析
??????
·使用正則表達式加載數據
??????
·HQL高級語法
??????
·編寫UDF函數
??????
·編寫UDAF自定義函數"
?
模塊三、EasyHive倉庫優化
??????
·使用Hive分區優化查詢
??????
·使用Lzo壓縮優化數據存儲容量
??????
·HiveServer HA (使用haproxy提高HiveServer可用性)
??????
·編寫Hive自定義MapReduce腳本優化查詢
??????
·Hive數據傾斜和查詢性能優化"
?
模塊四、EasyHive倉庫外圍系統???
??????
·使用Sqoop進行數據分析
??????
·使用oozie配置工作流
??????
·phpHiveAdmin 安裝和使用
?
?
?
?
?
?
?