課程名稱:Hadoop 數據導入與導出培訓

        4401 人關注
        (78637/99817)
        課程大綱:

        Hadoop 數據導入與導出培訓

         

        一個經典的數據架構中,Hadoop 是處理復雜數據流的核心。

        數據往往是從許多分散的系統中收集而來,并導入 Hadoop 分布式文件系統(HDFS)中,

        通過 MapReduce 或者其他基于 MapReduce 封裝的語言進行處理。

        1
        導入和導出數據

        1.使用Hadoopshell命令導入和導出數據到HDFS

        2.Pig腳本來演示下getmerge命令的功能

        3.使用distcp實現集群間數據復制

        4.使用Sqoop從MySQL數據庫導入數據到HDFS

        5.使用Sqoop從HDFS導出數據到MySQL


        登錄 后發表評論
        新評論
        全部 第1節 第2節 第3節 第4節 第5節 第6節 第7節 第8節 第9節 第10節 第11節 第12節 第13節 第14節 第15節 第16節 第17節
        我的報告 / 所有報告