課程目錄: 大數據基礎與應用培訓
        4401 人關注
        (78637/99817)
        課程大綱:

                  大數據基礎與應用培訓

         

         

         

        01
        初識大數據
        了解大數據的定義、應用場景、分析流程和工作崗位需求

        1.1 大數據定義
        1.2 大數據應用場景
        1.3 大數據分析流程
        1.4 如何參與大數據分析
        02
        大數據應用縱覽
        展示大數據在不同行業的應用進展和趨勢。包括醫療大數據、旅游大數據,以及華為公司的兩個案例。

        2.1 大數據應用縱覽
        2.2 智能醫療大數據
        2.3 旅游大數據案例
        2.4 金融科技與大數據風控
        2.5 政務多跑一次
        03
        Python大數據基礎(一)
        介紹Python的基本數據類型和數據結構,Numpy和Pandas的使用方法,以及本課程所使用的在線實踐平臺。

        3.1 內置數據類型
        3.2 擴展數據類型
        3.3 內置數據結構
        3.4 Ndarray介紹
        3.5 Series介紹
        3.6 DataFrame介紹
        3.7 在線實驗平臺介紹
        3.8 數據類型和結構在線實驗
        04
        Python大數據基礎(二)
        介紹使用Python進行數據讀取、數據轉換、數據交換和數據展示等相關內容。

        4.1 文件讀寫
        4.2 文件和文件夾處理
        4.3 數據庫存取
        4.4 CSV和Excel數據交換
        4.5 JSON和XML數據交換
        4.6 Web數據交換
        4.7 用pandas加工數據
        4.8 用Matplotlib展示數據
        4.9 數據加工和展示在線實驗
        05
        數據分析方法(一)
        學習并掌握統計數據分析,主要包括數據的中心趨勢度量、 數據的離散程度度量、數據分布的度量和圖形化分析方法。

        5.1 數據分析方法概述
        5.2 統計數據分析方法
        5.3 數據的中心趨勢度量
        5.4 數據的離散程度度量
        5.5 數據分布的度量
        5.6 圖形化分析方法
        06
        數據分析方法(二)
        學習并掌握基于機器學習的數據分析方法,主要包括機器學習的典型任務,常見的有監督學習和無監督學習算法。

        6.1 機器學習簡介
        6.2 機器學習的典型任務
        6.3 決策樹算法
        6.4 K-近鄰分類算法(KNN算法)
        6.5 K-均值聚類算法(K-means算法)
        6.6 Apriori關聯規則算法
        6.7 在線實驗
        07
        開源平臺和工具(一)
        介紹數據獲取、清洗與存儲等相關的開源平臺和工具

        7.1 數據采集與清洗概述
        7.2 日志數據采集Flume簡介
        7.3 數據分發中間件Kafka簡介
        7.4 HDFS介紹及使用方法
        7.5 HBase介紹及使用方法
        7.6 Hive介紹及使用方法
        7.7 NoSQL數據庫技術
        08
        開源平臺和工具(二)
        介紹批處理、流式數據處理與分析以及資源管理與調度的開源平臺和工具

        8.1 批處理:MapReduce
        8.2 批處理:Spark
        8.3 PageRank舉例
        8.4 流處理:Storm
        8.5 流處理:Spark Streaming
        8.6 資源管理與調度概述
        8.7 Zookeeper介紹及使用方法
        8.8 在線實驗
        09
        數據可視化
        介紹數據可視化的基本方法和技術。

        9.1 數據可視化簡介
        9.2 高維數據可視化
        9.3 網絡和層次化數據可視化
        9.4 時空數據可視化
        9.5 文本數據可視化
        9.6 可視化在線實驗
        10
        綜合實踐
        以旅游大數據為例展示大數據分析的流程和方法。

        10.1 旅游大數據在線實驗