
GPU-CUDA培訓(xùn)
CUDA入門
一:GPU并行計算
二:深度學習與GPU
三:CUDA環(huán)境搭建
CUDA架構(gòu)
一:CUDA架構(gòu)演變歷史
二:S M計算架構(gòu)
三:存儲架構(gòu)
CUDA編程
一:CUDA C 編程
二:0PENMP介紹
三:CUDA調(diào)試方法
編程實例
一:矩陣乘法
二:卷積計算
CUDA優(yōu)化
一:CUDA通信
二:多卡編程
三:內(nèi)核優(yōu)化
四:調(diào)優(yōu)工具使用
CUDA常用優(yōu)化手段
一:并發(fā)優(yōu)化
二:流優(yōu)化
三:訪存優(yōu)化
四:矩陣乘法實例
五:卷積計算實例
CUDA的優(yōu)化手段
一:指令流效率
二:指令集優(yōu)化
三:循環(huán)展開
四:cache利用率