第一部分. Python基礎
第一部份:Python的概覽——Python的基本介紹、安裝與基本語法、變量類型與運算符
第二部份:了解Python流程控制——條件、循環(huán)語句與其他語句
第三部份:常用函數(shù)——函數(shù)的定義與使用方法、主要內置函數(shù)的介紹
第四部份:NumPy基礎——數(shù)組的創(chuàng)建、組合與分割
第二部分 數(shù)據(jù)分析的準備
第五部份:了解數(shù)據(jù)——數(shù)據(jù)加載、儲存與文件格式;異常值的清理與缺失值處理
第六部份:數(shù)據(jù)清洗與初步分析——數(shù)據(jù)清理、轉換、合并與重塑;數(shù)據(jù)匯總與描述統(tǒng)計;
第七部份:繪圖與可視化——基本繪圖命令與圖形概覽、圖形元素設定與實例:地震危機數(shù)據(jù)的可視化
第八部份:數(shù)據(jù)聚合與分組處理——數(shù)據(jù)聚合、分組運算與轉換、透視表與交叉表
第三部分 數(shù)據(jù)分析初探
第九部份:假設檢驗——常用假設檢驗與實例分析
第十部份:線性回歸——線性回歸模型、分析結果呈現(xiàn)與解讀;實例:商品價格預測
第十一部份: logistic回歸——logistic回歸模型講解;實例:電信客戶流失分析
第十二部份:時間序列分析——時間序列基本處理、時間序列模型構建與結果解讀;實例:未來股票價格預測
第四部分 深入數(shù)據(jù)分析
第十三部份:分類算法——knn、決策樹、貝葉斯分類器等算法介紹;實例:網(wǎng)頁注冊用戶預測
第十四部份:聚類算法——k-means算法介紹;實例:通信基站聚類分析
第十五部份:降維方法——主成分分析與因子分析算法介紹;實例:地區(qū)經(jīng)濟指標評分