近年來,大數據分析逐漸火熱,成為提升企業競爭力的重要手段。由于傳統關系型數據庫有難以擴展的弱點,以Hadoop為主流的新興分布式集群解決方案逐漸擊敗傳統數據庫,成為大數據分析領域的霸主。在煉數成金的基礎課程《Hadoop數據分析平臺》里,對Hadoop的兩大支柱技術HDFS和Map-Reduce以及Hadoop生態圈的各個子產品作了詳細的介紹和學習。
我們致力于向學員描畫若干真正的企業級數據分析項目的全貌,我們會分別站在甲方——需求者,乙方團隊——數據架構師、算法設計師、IT系統架構師、開發工程師等多個角色的角度來審視項目整個過程,向大家展示項目的業務背景,數據建模,算法設計,集群設計和部署,系統開發編碼等過程的全貌,使大家有親歷其境的感覺,猶如自己身處于項目團隊之中,熟悉大數據分析項目的完成工序。無論你的個人目標是何種角色,都能在課程中有所收獲。
本課程覆蓋互聯網,電子商務,電信運營商,金融行業,地理位置應用等多個領域,每一次課就是一個獨立的項目,這些實戰內容將可以使大家在基礎課程之后,更加理解Hadoop在實際中是如何使用,同時吸取跨行業的項目知識經驗,對將來的個人發展將大有裨益。
第1節 Hadoop基礎回顧
第2節 Hadoop應用情況綜述
第3節 巨型網站日志系統分析,提取KPI數據(Map-Reduce)
第4節 電信運營商LBS應用,分析手機用戶移動軌跡(Map-Reduce)
第5節 電信運營商用戶分析,通過通話指紋判斷重入網用戶(map-Reduce)
第6節 電子商務推薦系統設計(Map-Reduce)
第7節 更復雜的推薦系統場景(Mahout)
第8節 社交網絡,判斷微博用戶關系親疏程度,發現社區(Pig)
第9節 在社交網絡中衡量節點的重要程度(Map-Reduce)
第10節 聚類算法應用,分析優質客戶(Map-Reduce,Mahout)
第11節 金融數據分析,從歷史數據中提取逆回購信息(Hive)
第12節 通過數據分析制定股票策略(Map-Reduce,Hive)
第13節 GPS應用,簽到數據分析(Pig)
第14節 Map-Reduce全排序實現和優化
第15節 中間件開發,讓多個Hadoop集群協作起來 |