課程目錄:R數據挖掘技術-基于R語言的數據挖掘和統計分析技術”培訓
        4401 人關注
        (78637/99817)
        課程大綱:

                R數據挖掘技術-基于R語言的數據挖掘和統計分析技術”培訓

         

         

         

        第一講數據挖掘和R簡介

        1.1 數據挖掘

        1.2 R語言

        1.3 Iris數據集

        1.4Bodyfat數據集

        第二講數據的導入與導出

        2.1 R數據的保存與加載

        2.2 CSV文件的導入與導出

        2.3 通過0DBC從數據庫中讀取數據

        2.4 從Excel中導入與導出數據

        第三講數據可視化展現

        3.1 查看數據

        3.2 單個變量展現

        3.3 多個變量展現

        3.4 更多探索

        3.5 將圖表保存到文件中

        第四講決策樹與隨機森林

        4.1 使用party包構建決策樹

        4.2 使用rpart包構建決策樹

        4.3 隨機森林

        第五講回歸分析

        5.1 線性回歸

        5.2 邏輯回歸

        5.3 廣義線性回歸

        5.4 非線性回歸

        第六講聚類分析

        6.1 k-means聚類

        6.2 k-medoids聚類

        6.3 層次聚類

        6.4 基于密度的聚類

        第七講離群點檢測

        7.1 單變量的離群點檢測

        7.2 局部離群點因子檢測

        7.3 用聚類方法進行離群點檢測

        7.4 時間序列數據的離群點檢測

        第八講時間序列分析

        8.1 R中的時間序列數據

        8.2 時間序列分解

        8.3 時間序列預測

        8.4 時間序列聚類

        8.5 時間序列分類

        第九講關聯規則

        9.1 關聯規則的基本概念

        9.2 Titanic數據集

        9.3 關聯規則挖掘

        9.4 冗余

        9.5 解釋規則

        9.6 關聯規則的可視化

        第十講社交網絡分析

        10.1 詞項網絡

        10.2 推文網絡

        10.3 雙模式網絡

        第十一講 R與Hadoop/Spark等大數據技術的融合

        1)R/Hadoop數據處理技術介紹

        2)SparkR數據處理技術介紹

        3)基于Hadoop/Yarn集群的應用展望

        六、培訓

        1,了解R語言數據挖掘的相關知識。

        2,學習R的數據挖掘核心技術方法以及應用特征。

        3,深入使用R在數據挖掘和分析中的使用。

        4,了解R與Hadoop、Spark等技術的融合使用。