課程目錄:“R數(shù)據(jù)挖掘技術(shù)-基于R語言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)培訓(xùn)
        4401 人關(guān)注
        (78637/99817)
        課程大綱:

              R數(shù)據(jù)挖掘技術(shù)-基于R語言的數(shù)據(jù)挖掘和統(tǒng)計(jì)分析技術(shù)培訓(xùn)

         

         

         

        第一講數(shù)據(jù)挖掘和R簡介

        1.1 數(shù)據(jù)挖掘

        1.2 R語言

        1.3 Iris數(shù)據(jù)集

        1.4Bodyfat數(shù)據(jù)集

        第二講數(shù)據(jù)的導(dǎo)入與導(dǎo)出

        2.1 R數(shù)據(jù)的保存與加載

        2.2 CSV文件的導(dǎo)入與導(dǎo)出

        2.3 通過ODBC從數(shù)據(jù)庫中讀取數(shù)據(jù)

        2.4 從Excel中導(dǎo)入與導(dǎo)出數(shù)據(jù)

        第三講數(shù)據(jù)可視化展現(xiàn)

        3.1 查看數(shù)據(jù)

        3.2 單個變量展現(xiàn)

        3.3 多個變量展現(xiàn)

        3.4 更多探索

        3.5 將圖表保存到文件中

        第四講決策樹與隨機(jī)森林

        4.1 使用party包構(gòu)建決策樹

        4.2 使用rpart包構(gòu)建決策樹

        4.3 隨機(jī)森林

        第五講回歸分析

        5.1 線性回歸

        5.2 邏輯回歸

        5.3 廣義線性回歸

        5.4 非線性回歸

        第六講聚類分析

        6.1 k-means聚類

        6.2 k-medoids聚類

        6.3 層次聚類

        6.4 基于密度的聚類

        第七講離群點(diǎn)檢測

        7.1 單變量的離群點(diǎn)檢測

        7.2 局部離群點(diǎn)因子檢測

        7.3 用聚類方法進(jìn)行離群點(diǎn)檢測

        7.4 時間序列數(shù)據(jù)的離群點(diǎn)檢測

        第八講時間序列分析

        8.1 R中的時間序列數(shù)據(jù)

        8.2 時間序列分解

        8.3 時間序列預(yù)測

        8.4 時間序列聚類

        8.5 時間序列分類

        第九講關(guān)聯(lián)規(guī)則

        9.1 關(guān)聯(lián)規(guī)則的基本概念

        9.2 Titanic數(shù)據(jù)集

        9.3 關(guān)聯(lián)規(guī)則挖掘

        9.4 冗余

        9.5 解釋規(guī)則

        9.6 關(guān)聯(lián)規(guī)則的可視化

        第十講社交網(wǎng)絡(luò)分析

        10.1 詞項(xiàng)網(wǎng)絡(luò)

        10.2 推文網(wǎng)絡(luò)

        10.3 雙模式網(wǎng)絡(luò)

        第十一講 R與Hadoop/Spark等大數(shù)據(jù)技術(shù)的融合

        1)R/Hadoop數(shù)據(jù)處理技術(shù)介紹

        2)SparkR數(shù)據(jù)處理技術(shù)介紹

        3)基于Hadoop/Yarn集群的應(yīng)用展望

        六、培訓(xùn)

        1,了解R語言數(shù)據(jù)挖掘的相關(guān)知識。

        2,學(xué)習(xí)R的數(shù)據(jù)挖掘核心技術(shù)方法以及應(yīng)用特征。

        3,深入使用R在數(shù)據(jù)挖掘和分析中的使用。

        4,了解R與Hadoop、Spark等技術(shù)的融合使用。