
Hadoop 數據導入與導出培訓
一個經典的數據架構中,Hadoop 是處理復雜數據流的核心。
數據往往是從許多分散的系統中收集而來,
并導入 Hadoop 分布式文件系統(HDFS)中,
通過 MapReduce 或者其他基于 MapReduce 封裝的語言進行處理。
1
導入和導出數據
1.使用Hadoopshell命令導入和導出數據到HDFS
2.Pig腳本來演示下getmerge命令的功能
3.使用distcp實現集群間數據復制
4.使用Sqoop從MySQL數據庫導入數據到HDFS
5.使用Sqoop從HDFS導出數據到MySQL

請
登錄
后發表評論
新評論
全部
第1節
第2節
第3節
第4節
第5節
第6節
第7節
第8節
第9節
第10節
第11節
第12節
第13節
第14節
第15節
第16節
第17節
我的報告 / 所有報告