第一部分:初識(shí)Stata與數(shù)據(jù)讀入
1)熟悉界面
2)尋求幫助(在線幫助、搜索幫助等)
3)DOS命令(cd、dir、erase、rm、shell等)
4)Winexec調(diào)用windows系統(tǒng)相關(guān)操作
5)copy命令(文件操作、網(wǎng)頁(yè)源代碼讀取等)
6)Stata常用30個(gè)命令介紹
7)日期定義(日期格式設(shè)置、日期函數(shù)等)
8)函數(shù)(字符串函數(shù)、隨機(jī)函數(shù)、編程函數(shù)等)
9)egen函數(shù)與常見統(tǒng)計(jì)量
10) txt、csv、excel等格式文件讀入
11)Wind交易數(shù)據(jù)整理案例
12)基金經(jīng)理變更數(shù)據(jù)整理案例
第二部分:宏與循環(huán)
1)local與global概念與基本操作
2)宏擴(kuò)展函數(shù)
3)while、foreach、forvalue循環(huán)
4)跳出循環(huán)的continue 和continue, break
5)批量處理多個(gè)目錄下的多個(gè)文件(fs命令)
6)批量處理多個(gè)變量的多個(gè)取值(levelsof命令)
7)NBER工作論文下載案例
8)上交所年報(bào)爬取綜合案例
9)CSMAR交易和財(cái)務(wù)數(shù)據(jù)整理案例
第三部分:數(shù)據(jù)庫(kù)操作
1)數(shù)據(jù)的縱向合并、橫向合并與長(zhǎng)寬變換
2) 工企數(shù)據(jù)庫(kù)運(yùn)用案例
3) Wind財(cái)務(wù)數(shù)據(jù)整理案例
4)美國(guó)流行歌曲目錄整理案例
5)起死回生命令(preserve與restore)
6) CSSCI期刊目錄整理案例
7) label命令介紹
8) labelsof、label 的宏擴(kuò)展函數(shù)
9)字符串處理(關(guān)鍵詞、替換、提取等)
第四部分:Post命令
1)post原理
2)定義post
3)用post計(jì)算股價(jià)同步性和Beta
4)基于網(wǎng)絡(luò)數(shù)據(jù)的事件研究
5)股本變更數(shù)據(jù)整理案例
第五部分:回歸分析及結(jié)果輸出
1)putdocx命令輸出內(nèi)容至word文檔
a)編輯docx文件中的文字內(nèi)容
b)輸出并編輯表格內(nèi)容
c)輸出內(nèi)存中的list結(jié)果
d)輸出矩陣
e)輸出繪圖
2)putdocx命令相關(guān)案例
a)輸出十進(jìn)位制下的漢字unicode編碼
b)結(jié)合常用漢字生成隨機(jī)漢字組成的段落
c)爬取并輸出陜西省人大代表信息
3)實(shí)證結(jié)果輸出
a)描述性統(tǒng)計(jì)信息:sum2docx
b)分組均值t檢驗(yàn):t2docx
c)相關(guān)系數(shù)矩陣:corr2docx
d)回歸結(jié)果:reg2docx
4)實(shí)證結(jié)果輸出完整展示
高級(jí)班課程大綱
第一部分:正則表達(dá)式
1)正則表達(dá)式基本函數(shù)介紹
a)ustrregexm()
b)ustrregexs()
c)ustrregexrf()與ustrregexra()
2)正則表達(dá)式元字符介紹
a)基本元字符
b)數(shù)量元字符
c)位置元字符
d)前后查找
e)特殊字符元字符
f)回溯引用
g)unicode編碼
3)正則表達(dá)式匹配模式
a)貪婪模式
b)懶惰模式
4)正則表達(dá)式例子
a)郵編提取
b)英文姓與名的拆分
c)CSSCI數(shù)據(jù)預(yù)處理
d)百度新聞數(shù)量
e)城市名稱提取
f)pdf表格數(shù)據(jù)的提取
g)英文姓名的拆分
h)用正則表達(dá)式提取日期
i)北大法寶裁判文書信息提取
5)正則表達(dá)式相關(guān)命令
a)moss命令與簡(jiǎn)單的詞頻統(tǒng)計(jì)
b)subinfile命令對(duì)文本文檔進(jìn)行操作
第二部分:網(wǎng)絡(luò)爬蟲
1)爬蟲初步
a)新浪高管任職數(shù)據(jù)抓取
b)NBER Working Paper信息的抓取
c)百度地圖api調(diào)用
2)尋找真實(shí)鏈接
a)和訊網(wǎng)港股數(shù)據(jù)
b)深交所信息披露質(zhì)量
c)百度新聞逐年數(shù)據(jù)獲取
3)調(diào)用curl
a)新浪財(cái)經(jīng)港股數(shù)據(jù)獲取
b)環(huán)保部AQI獲取
第三部分:文本分析
1)分詞原理
2)分詞的實(shí)現(xiàn)
a)ustrwordcount()和ustrword()
b)調(diào)用Python的jieba和pynlpir
c)Bosonnlp的API
d)詞頻統(tǒng)計(jì)
3)高亮輸出文章重點(diǎn)
4)詞云圖的實(shí)現(xiàn)
5)情感分析原理
6)情感分析的實(shí)現(xiàn)
a)年報(bào)MDA語(yǔ)調(diào)分析
b)構(gòu)建詞庫(kù)計(jì)算情感值
c)大眾點(diǎn)評(píng)日料評(píng)論情感分析
第四部分:實(shí)證研究方法
1) 工具變量方法(IV)
a)工具變量方法介紹
b)現(xiàn)代IV方法:LATE
c)IV方法應(yīng)用一般步驟:論文案例與Stata實(shí)操
2) 斷點(diǎn)回歸方法(RD)
a)RD方法思想和方法演進(jìn)
b)精準(zhǔn)斷點(diǎn)(Shape RD)與模糊斷點(diǎn)(Fuzzy RD)
c)RD方法應(yīng)用一般步驟:論文案例與Stata實(shí)操
3) 倍差法(DID)
a)DID模型設(shè)定、參數(shù)估計(jì)和假設(shè)檢驗(yàn)
b)DID方法與固定效應(yīng)估計(jì)(FE):聯(lián)系和區(qū)別
c)IV方法應(yīng)用一般步驟:論文案例與Stata實(shí)操
d)DDD(三重差分)方法介紹與應(yīng)用
e)DDD論文案例與Stata實(shí)操 |