歸納數(shù)據(jù)集;金融數(shù)據(jù)標(biāo)準(zhǔn)化;支持向量機(jī)分類(lèi)模型的選擇和應(yīng)用;用支持向量機(jī)模型進(jìn)行預(yù)測(cè); 模型評(píng)估
適用人群
學(xué)習(xí)金融學(xué)、數(shù)據(jù)、計(jì)算機(jī)的高校生、在職的基金經(jīng)理、投研總監(jiān)、專(zhuān)業(yè)投資者、金融分析師、量化分析
課程簡(jiǎn)介
案例數(shù)據(jù)集來(lái)源于UCI網(wǎng)站。該數(shù)據(jù)集中的圖象數(shù)據(jù)分別來(lái)源于真紙幣和偽紙幣。通常是通過(guò)工業(yè)相機(jī)生成400x 400像素的圖象。然后利用小波變換工具從圖象中提取相關(guān)特征。數(shù)據(jù)集中共有1372條記錄,4個(gè)連續(xù)型的特征變量,和1個(gè)二元分類(lèi)變量,無(wú)缺失數(shù)據(jù)。
支持向量機(jī)分類(lèi)算法是機(jī)器學(xué)習(xí)中的一個(gè)基礎(chǔ)且非常重要的算法。它利用傳統(tǒng)的數(shù)學(xué)優(yōu)化方法,即,二次函數(shù)的優(yōu)化,對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。Python的優(yōu)勢(shì)在于開(kāi)源,基于Python的各類(lèi)機(jī)器學(xué)習(xí)算法非常豐富而且方便使用。我們將以紙幣識(shí)別案例數(shù)據(jù)集為一個(gè)點(diǎn)的同時(shí),討論支持向量機(jī)分類(lèi)原理和Python算法并用他們來(lái)區(qū)分真紙幣和偽紙幣。
本案例的特點(diǎn)是將識(shí)別真假紙幣的金融決策問(wèn)題的解決方案與機(jī)器學(xué)習(xí)中的支持向量機(jī)算法進(jìn)行結(jié)合,并利用Python設(shè)計(jì)一個(gè)自動(dòng)分類(lèi)算法來(lái)對(duì)案例數(shù)據(jù)集進(jìn)行學(xué)習(xí)并輔助我們進(jìn)行決策。這三者的結(jié)合就是智能金融在金融行業(yè)的一種經(jīng)典應(yīng)用。
學(xué)生通過(guò)本案例的學(xué)習(xí)將能夠充分理解并在未來(lái)能夠使用支持向量機(jī)算法和Python程序來(lái)解決一個(gè)具體金融決策問(wèn)題。本案例中還將介紹數(shù)據(jù)預(yù)處理和變量工程概念,從而有助于掌握數(shù)據(jù)處理的方法和技巧。
通過(guò)案例學(xué)習(xí)后,如果學(xué)生能夠獨(dú)立完成作業(yè),學(xué)生將能達(dá)到以下預(yù)期目標(biāo):
能夠?qū)w納一個(gè)金融問(wèn)題的數(shù)據(jù)集;
2. 金融數(shù)據(jù)的處理和標(biāo)準(zhǔn)化;
3. 支持向量機(jī)分類(lèi)模型的選擇和應(yīng)用;
4. 用支持向量機(jī)模型進(jìn)行預(yù)測(cè);
5. 對(duì)支持向量機(jī)模型進(jìn)行評(píng)估 |