自然語言處理(NLP)是人工智能和語言學領域的一個分支學科,同時也是機器學習中熱的一個方向之一。試想想,機器可完全明白人類的語言,并且可以嫻熟地使用自然語言與人類溝通,這不就是人工智能的目標?目前,我們處理的數據,并不僅僅只有數值型數據,還包含了大量的文本數據。對于傳統的分析技術來說,文本數據中的真正含義無法真正解析出來,是對文本信息的較大浪費。幸好,現在各種文本預處理、文本挖掘技術已日漸成熟,可以幫助我們從文本中提取出更多有意義的信息。
第一部分:算法軟件基礎:介紹不同算法工具的基本使用語法
第一節:語言模型SRILM——用SRILM訓練語言模型
第二節: 隱馬爾可夫模型HTK入門——HTK的安裝與使用
第三節: 隱馬爾可夫模型HTK深入——HTK使用詳解
第四節: 隱馬爾可夫模型HTK實例——簡單的語音撥號應用程序
第五節: 條件隨機場CRF++——CRF++的安裝與使用
第六節: 較大熵模型OpenNLP——OpenNLP的安裝與基本功能
第七節: 較大熵模型MALLET——MALLET的安裝與使用
第八節:中文NLP工具包——FudanNLP入門
第九節:中文NLP工具包——StanfordNLP各個模塊介紹
第二部分:實驗案例操作
第十節:中文NLP基礎,分詞處理與詞性標注——對比常用的中文分詞工具的使用
第十一節:命名實體識別的實現
第十二節:文本分類與情感分析——商品評論傾向性分析
第十三節:文本關鍵信息提取——關鍵詞提取與文本摘要
|