?
目標收益
課程中的理論和經驗來自于對初級數據挖掘工程經常遇問題的歸納、分析與總結,有針對性的給出解決方法,課程將重現這些問題的經典案例,通過實例講解,并對應到學員的實際工作問題,使學員能夠把傳授的經驗和自己的問題結合起來,有效的啟發思路、激發興趣、提供解決問題需要的新思路新方法。
學員的收獲總結起來有3點:
1:了解實際的事例結合說基本算法的各種變體,開闊思路
2:將一次培訓深化為深入了解一個細分領域的一個渠道,之后可以接收到培訓內容中知識點對應的業界新更新。
3:加入“數據挖掘”職業圈,學員可以有一個加入職業社交圈的機會,和業內人士相互交流,相互切磋。
培訓對象
1:有一定的程序和數學基礎,希望對于數據挖掘有個知識體系的梳理,同時深入了解在實際生產過程中數據挖掘的各種算法的應用的,希望從初級走向中級的,數據增值產業的從業者。尤其是想做數據挖掘但是效果不顯著,希望在公司內部得到更多重視的團隊,派出兩三人參加這個課程,效果尤佳。
2:對于數據挖掘,商業智能感興趣,希望從事類似的工作,但是又感到所謂“大數據”知識體系繁雜,無論是廣度還是深度都很難開始的“迷茫”人士。
學員基礎
學員學習本課程應具備下列基礎知識:
1) 知道統計學的一些基本概念:平均分布,正態分布,方差,置信區間;?
2) 知道數據結構的一些基本概念:時間,空間復雜度;
3) 知道計算機體系結構的一些基本概念:GPU,芯片,寄存器,內存尋址,總線傳輸,內網通信
課程大綱
?
主題 |
內容 |
廣義線性分類的原理和應用 |
內容:logistic Regression和計算廣告學 n1.二分類問題的例子n2.邏輯回歸的數學原理n3.傳統廣告,計算廣告,廣告實時交易平臺n4.數據預處理和維度提取n5.LR在計算廣告中的應用n6.LR的效果測評,模型調優n7.LR模型中理論與工程的折中n8.LR和他的小伙伴們:廣義線性模型n9.新情況,基于移動端的廣告實時交易平臺,LR的各種變體 |
決策樹,聚類和異常點檢測 |
內容:決策樹和異常點檢測n1.決策樹的原理n2.各種決策樹的生成算法n3.決策樹在異常點檢測中的應用n4.決策樹的剪枝n5.其它異常點檢測的應用小技巧n6.聚類算法的原理n7.聚類算法的常見問題:初始點選擇,n8.聚類算法和決策樹在異常點檢測中的應用n9.結合計算廣告,談兩個異常點檢測小例子 |
巨型圖挖掘 |
1.復雜網絡介紹n2.當前巨型圖應用場景n3.隨機圖,自然圖,n4.常用的圖計算框架(google的bagel,graphlab的graphx)n5.巨型圖上的算法實現原理n6.常用的基于圖的算法實現n7.隨機游走,pageRank基于圖的實現n8.svd介紹以及svd在圖框架的實現n9.圖挖掘與推薦系統(qzone的廣告系統廣點通,twitter的內容推薦) |