
CDA_Hadoop大數(shù)據(jù)分析師培訓(xùn)
大數(shù)據(jù)基礎(chǔ)知識(shí)
Linux及unbuntu系統(tǒng)基礎(chǔ)
Hadoop的單機(jī)和偽分布模式的安裝配置
第一階段:大數(shù)據(jù)前沿知識(shí)及Hadoop入門
預(yù)期效果:零基礎(chǔ)入門,了解大數(shù)據(jù)的歷史背景及發(fā)展方向,掌握Hadoop多種安裝配置
第二階段:Hadoop部署進(jìn)階
1.Hadoop集群模式搭建
2. Hadoop分布式文件系統(tǒng)HDFS深入剖析
3.使用hdfs提供的api進(jìn)行hdfs文件操作
熟練掌握Hadoop集群搭建;對(duì)Hadoop架構(gòu)的分布式文件系統(tǒng)HDFS進(jìn)行深入分析
第三階段:Java基礎(chǔ)及實(shí)戰(zhàn)
1. java程序的基本框架
2. Java的數(shù)據(jù)類型與表達(dá)式介紹
3. java程序設(shè)計(jì)的基礎(chǔ)
4.java的面向?qū)ο缶幊碳胺椒?/p>
5.mysql數(shù)據(jù)庫基礎(chǔ)知識(shí)
零基礎(chǔ)入門,了解java程序設(shè)計(jì)的基本思想,熟練利用eclipse進(jìn)行簡單的java程序設(shè)計(jì),熟練使用jar文件,了解mysql等數(shù)據(jù)庫管理系統(tǒng)的原理,基于web的程序開發(fā)流程
第四階段:Mapreduce理論及實(shí)戰(zhàn)
1. Mapreduce概念及思想
2.mapreduce構(gòu)架和流程
3.三個(gè)基于mapreduce的初級(jí)案例
4.mapreduce高級(jí)案例--人大經(jīng)濟(jì)論壇日志管理
熟悉Mapreduce的工作原理及應(yīng)用,熟悉基本的Mapreduce程序設(shè)計(jì),掌握根據(jù)大數(shù)據(jù)分析的目標(biāo)設(shè)計(jì)和編寫基于Mapreduce的項(xiàng)目
第五階段:Hadoop+Mahout大數(shù)據(jù)分析
1. mahout學(xué)習(xí)之簡介、安裝及配置
2. 六個(gè)實(shí)戰(zhàn)案例深入解析hadoop+mahout的大數(shù)據(jù)分析之分類、聚類與主題推薦
掌握基于hadoop+mahout的大數(shù)據(jù)分析方法的使用場景,熟練運(yùn)用mahout的成熟算法進(jìn)行特定場景的大數(shù)據(jù)分析
第六階段:Hbase Spark理論及實(shí)戰(zhàn)
1. hbase簡介、安裝及配置
2. hbase實(shí)戰(zhàn)
掌握hbase的數(shù)據(jù)存儲(chǔ)及項(xiàng)目實(shí)戰(zhàn),Spark、Hive的安裝、配置及使用場景
第七階段:Hadoop+Spark大數(shù)據(jù)分析
實(shí)戰(zhàn)案例深入解析Hadoop+Spark的大數(shù)據(jù)分析之分類、Logistic回歸與主題推薦
掌握基于hadoop+Spark的大數(shù)據(jù)分析方法的使用場景,熟練運(yùn)用Spark的成熟算法進(jìn)行特定場景的大數(shù)據(jù)分析