培訓目標:
本課程結束后,受培訓人員將能熟練使用Modeler軟件,能夠根據(jù)常見的不同種類的數(shù)據(jù)挖掘研究需要進行方案設計、數(shù)據(jù)分析、建模和報告的撰寫。在培訓中將安排一系列討論會和實際數(shù)據(jù)練習,以保證學員有足夠的實踐機會實際操作Modeler軟件。
Modeler培訓課程內容:
1 統(tǒng)計分析方法與數(shù)據(jù)挖掘基本原理培訓
?
課程描述
?
介紹數(shù)據(jù)挖掘方法論以及CRISP-DM的6個步驟
?
培訓對象
?
戰(zhàn)略規(guī)劃部、市場研究部、數(shù)據(jù)分析部等相關研究人員
?
必要技能
?
統(tǒng)計方法基礎知識、數(shù)據(jù)挖掘基本原理
?
培訓內容
?
統(tǒng)計分析方法與數(shù)據(jù)挖掘基本原理
?
第一講
?
如何從掌握統(tǒng)計方法到掌握數(shù)據(jù)挖掘
?
與傳統(tǒng)的統(tǒng)計分析方法相比而言:
?
什么是數(shù)據(jù)挖掘?
?
數(shù)據(jù)挖掘能做什么?
?
數(shù)據(jù)挖掘在協(xié)助企業(yè)業(yè)務的分類、預測、聚類和模型可視化方面的特點;
?
數(shù)據(jù)挖掘在其他商業(yè)領域的應用,如完善客戶關系管理、贏得市場營銷戰(zhàn)役;
?
如何從掌握統(tǒng)計分析方法到掌握數(shù)據(jù)挖掘?
?
第二講
?
數(shù)據(jù)挖掘基本原理和實踐操作方法論
?
數(shù)據(jù)挖掘的基本原理
?
數(shù)據(jù)挖掘實踐中所要求的數(shù)據(jù)結構、衍生變量和數(shù)據(jù)轉換
?
數(shù)據(jù)挖掘的模型建構方法、模型的評估、模型的檢驗和修訂
?
目前主流的數(shù)據(jù)挖掘工具軟件比較
?
如何在實踐操作中運用CRISP-DM數(shù)據(jù)挖掘程序
?
如何從商業(yè)角度和數(shù)據(jù)角度了解數(shù)據(jù)挖掘解決問題的類型和思路
?
CRISP-DM的6個步驟以及每個步驟應該完成的工作和產生的結果
?
2、 Modeler軟件操作基礎及數(shù)據(jù)處理使用培訓
?
培訓對象
?
客戶企業(yè)所指派的Modeler實際使用人員
?
涉及產品
?
Modeler
?
培訓內容
?
Modeler軟件操作基礎培訓
?
Modeler的數(shù)據(jù)處理技術
?
第一講
?
操作概述
?
基礎界面介紹:
?
Modeler?14.2所包含的功能模塊
?
與Modeler先前版本的比較
?
基礎操作之數(shù)據(jù)準備
?
讀取數(shù)據(jù)文件
?
數(shù)據(jù)質量評估
?
數(shù)據(jù)處理
?
尋找數(shù)據(jù)中的關系
?
第二講
?
建模概述
?
Modeler中所包含的數(shù)據(jù)建模概述
?
神經網絡技術建模
?
決策樹技術建模
?
模型比較與模型合并
?
Kohonen神經網絡
?
關聯(lián)規(guī)則
?
時序發(fā)現(xiàn)
?
模型的發(fā)布
?
第三講
?
數(shù)據(jù)處理技術
?
?
合并多個數(shù)據(jù)源數(shù)據(jù)
?
抽取樣本,選擇和緩存數(shù)據(jù)
?
處理缺失數(shù)據(jù)
?
處理日期
?
處理時序數(shù)據(jù)
?
文件操作
?
數(shù)據(jù)聚合
?
附錄:?通過ODBC讀取數(shù)據(jù)
?
附錄:?Modeler的數(shù)據(jù)庫連接
?
?
3 Modeler的高級建模
?課程描述
?
介紹Modeler的建模技術以及Meta?Modeling技術
?
培訓對象
?
完成第二、三課學習的學員
?
必要技能
?
第二、三課學習的技能
?
培訓內容
?
利用神經網絡完成分群(Neural?networks?for?classification)
?
高級規(guī)則歸納(Advanced?rule?induction)
?
聚類技術(clustering)
?
高級關聯(lián)規(guī)則(Advanced?association?rules)
?
線性回歸(Linear?Regression)
?
邏輯回歸(Logistic?Regression)
?
濃縮數(shù)據(jù):基本組件(Data?Reduction:?Principal?Components)
?
從模型中獲取數(shù)據(jù)(meta?models,?error?modeling)
?