HDFS(Hadoop Distributed File System)是Hadoop項目的核心子項目,是分布式計算中數據存儲管理的基礎,是基于流數據模式訪問和處理超大文件的需求而開發(fā)的,可以運行于廉價的商用服務器上。
它所具有的高容錯、高可靠性、高可擴展性、高獲得性、高吞吐率等特征為海量數據提供了不怕故障的存儲,為超大數據集(Large Data Set)的應用處理帶來了很多便利。Hadoop分布式文件系統(tǒng)(HDFS)被設計成適合運行在通用硬件上的分布式文件系統(tǒng)。HDFS能提供高吞吐量的數據訪問,非常適合大規(guī)模數據集上的應用。
學完本套課程能夠掌握對hadoop的安裝,掌握HDFS-shell的操作,以及使用Java api對HDFS進行各種文件操作。