????沒接觸過深度學習同學或者是已經踏上工作崗位的同仁,我相信當中有很多人對這個技術感興趣,但不知從何下手,深度學習相對于計算機視覺而言,屬于入門很難的,需要長時間的積累,但是如果你的科研團隊在這方面有著豐富的積累,那入門要比你一個人摸索來著快得多,當然,大部分人都沒有這個條件,很可能一個小問題就能卡主很長的時間依然得不到解決,,,而我作為一個深度學習技術一線的研究人員,希望將這個技術介紹給各位感興趣的同學們,一個是幫你們節省大量入門這項技術的時間以及正確入門,另一個是讓你們有相應的基礎知識來實現一些論文中的項目,或者是開發自己的一些應用。
????也是考慮到很多的同學不熟悉linux操作系統,為避免大家陷入學習linux的困境之中,因而制作了這套基于windows的caffe學習教程。當然用linux系統的同學也無妨,只是一些命令上稍有不同,絕大多數內容是一樣的。
????整個課程提供了兩個caffe的深度學習項目,一個是《人臉檢測》另一個是《驗證碼識別》。課程中在vs2013下新建caffe工程,講解了caffe的基本數據結構,帶大家修改了caffe源碼使之滿足多標簽的輸入,并講明其中修改的原理,幫助同學們更加深入的了解caffe的源碼,也對caffe特征提取工具 extract_features.cpp 源碼進行詳細的講解和簡單的修改。
????在《人臉檢測》中我們采用了全卷積的神經網絡,能夠輸入不固定大小的圖片,且對于感受野的計算、特征圖上點的坐標與原圖的對應關系及計算進行了詳細的講解,這兩個概念是很多人比較模糊的概念,往往影響到了后續論文的閱讀,因而我們用專門的章節進行講解。
????《手寫數字識別》與《人臉檢測》都屬于單標記問題,而很多的競賽項目或者平時科研所需的項目要求都不僅僅是單標記的訓練,因而我以《驗證碼識別》項目像大家展示了如何設計多標記的訓練任務,在我們的《驗證碼識別》項目中,取得了100%的識別率,是個很有意思的項目,鼓勵大家去嘗試!
????此外,有同學是機電專業或者金融專業的,數據往往是非圖像數據,常常在問能否用caffe進行訓練?顯然是可以的,用hdf5格式即可,因而我也詳細介紹了如何把圖片/非圖片數據轉化為hdf5格式以便進行網絡訓練!