
SAS數(shù)據(jù)統(tǒng)計分析培訓(xùn)
一、SAS總體概覽
1.1課程介紹
1.2 SAS系統(tǒng)介紹
1.3 SAS模塊介紹
1.4 SAS界面講解
二、SAS數(shù)據(jù)集
2.1 SAS數(shù)據(jù)集與邏輯庫
2.2直接創(chuàng)建數(shù)據(jù):手動創(chuàng)建
2.3間接獲取數(shù)據(jù):訪問本地文件與數(shù)據(jù)庫
三、SAS語法
3.1基本概念
3.2語法規(guī)則
3.3語法錯誤診斷與修正
四、SAS編程之data步——數(shù)據(jù)預(yù)分析
案例1:如何管理數(shù)據(jù)集
案例2:數(shù)據(jù)格式的排列組合
案例3:數(shù)據(jù)的縱向匯總
案例4:條件語句的設(shè)置
五、SAS編程之proc步——統(tǒng)計描述
5.1平均數(shù)和標(biāo)準(zhǔn)差的意義
5.2正態(tài)分布有多重要
5.3數(shù)據(jù)標(biāo)準(zhǔn)化變換
5.4缺失值填補(bǔ)
六、編程之proc步——統(tǒng)計推斷
6.1差異性分析
——設(shè)檢驗(yàn)原理
——t檢驗(yàn):判斷組間差異
——方差分析:判斷多組間差異
——協(xié)方差分析:存在協(xié)變量的群組差異
6.2相關(guān)性分析
——散點(diǎn)圖提供了變量間的關(guān)系模式
——變量關(guān)系的基礎(chǔ):pearson、spearman相關(guān)系數(shù)
——偏相關(guān)分析
——多變量相關(guān)性:典型相關(guān)
6.3線性回歸分析
6.4穩(wěn)健的logistics回歸
預(yù)分析:卡方獨(dú)立性檢驗(yàn)
構(gòu)建模型與模型診斷、修正
自變量篩選與多模型評估:roc曲線
自變量的篩選:逐步回歸
何謂穩(wěn)健?
6.5 poisson回歸
6.6穩(wěn)健回歸
6.7主成分分析
6.8對應(yīng)分析
預(yù)分析:頻數(shù)、交叉表與卡方
一元對應(yīng)分析:行為與選擇的對應(yīng)特征
多元對應(yīng)分析:維度的意義
6.9聯(lián)合分析
七、數(shù)據(jù)挖掘(SAS/EM)
統(tǒng)計模型與數(shù)據(jù)挖掘的區(qū)別:數(shù)據(jù)量、數(shù)據(jù)度、時間、關(guān)注點(diǎn)
構(gòu)建預(yù)測模型:購傾向分析:基于回歸、決策樹、神經(jīng)網(wǎng)絡(luò)模型的預(yù)測