醫療大數據智能分析云平臺培訓
課程介紹:
???
本課程將使用影像數據、臨床數據、檢測報告、數據集成層、云端服務器、應用層等數據,詳細介紹使用特征值類型及特征值類型結合進行:一階統計量、形狀特征量、紋理特征量、高斯-拉普拉斯算子特征量、小波變換特征量、平方根濾波特征量、對數濾波特征量,重測信度分析、主成分分析、相關性分析、聚類分析等分析方法,進行全方面系統化講解;機器學習模型主要講解SVM Logistic regression? kNN Decision Tree? Random Forest? XGBoost 。
課程大綱
一、課程內容:
大數據平臺整體框架
1、數據來源
影像數據:包括DR、CT、MR、PET等;一 般為DICOM標準格式;結構圖像和功能圖像;
臨床數據:包括電子病例、體檢報告、隨訪 報告等;一般為非結構化數據;種類繁多,數據量大;?
檢測報告,包括病理檢測、分子檢測和遺傳 檢測;結構化和非結構化數據;圖片和文字 報告;快速發展中?
2、數據集成層
根據客戶需求,實現對不同廠商的PACS/HIS/LIS/RIS/EMR的對接,或者使用Uploader上傳無接口數據;實現高速、無損、安全、低費傳輸?
3、云端服務器
計算服務器,使用Docker/GPU等新的大數據處理服務器;實現數 據檢索、分析和統計;使用云計算、機器學習、自然語義分析等大數據處理技術?
存儲服務器,根據客戶需求,定制公有云/私有云/混合云;結構化數據使用MySQL,非結構 話數據使用Hadoop/MongoDB;實現分布式存儲,彈性分配存儲空間?
4、應用層?
日報/月報/年報? 院內醫療信息云檢索? 課題管理云平臺? 腦功能分析云平臺??
影像組學云平臺 腦梗/腦腫瘤智能分割? 胸片智能診斷
特征值類型
1、一階統計量?
? First Order Statistics,共19個,描述感興趣區內的強度信息?
? 包括mean, standard deviation, variance, maximum, median, range, kurtosis 等?
2、形狀特征量
? Shape, 共13個,描述感興趣區的形狀和大小特征?
? 包括volume, surface area, compactness, 2D/3D maximum diameter, flatness等??
3、紋理特征量
? Texture, 共60個,描述感興趣區內像素間關系,即圖像的紋理信息
? 包括28個Gray Level Co-occurrence Matrix (GLCM),16個Gray Level Size Zone Matrix (GLSZM),16個Gray Level Run Length Matrix (GLRLM)??
4、高斯-拉普拉斯算子特征量?
? Laplacian of Gaussian (LoG),共158個?
? 先用高斯函數對圖像進行平滑降噪,然后用拉普拉斯算子進行梯度運算,提取變換 后的圖像特征值
5、小波變換特征量
? Wavelet Transform, 共632個?
? 將圖像信號分解成一系列小波函數的疊加,主要用于圖像不同頻域信息的特征提取
6、平方根濾波特征量
? Square root filter, 共79個?
? 將圖像進行平方根濾波后計算其一階統計量和紋理特征量?
7、對數濾波特征量
? Logarithm filter, 共79個?
? 將圖像進行對數濾波后計算其一階統計量和紋理特征量
特征值分析:降低數據維度的方法
1、重測信度分析
? test-retest reliability?
? 用來測試特征值的穩定性和一致性?
? 對同一組被試進行兩次測量,然后得到結果的相關系數,相關程度高,
?
表示前后測量一致性高,穩定性好?
2、主成分分析
? Principal Component Analysis (PCA) analysis?
? 通過正交變換,將可能存在的相關性變量轉換為線性不相關變量,
?
轉換后的這 組變量叫做主成分?
? 根據累計貢獻率的大小提取前幾個大的主成分,既保留了原始的大部分信息,
?
又達到降維的目的?
3、相關性分析
? Correlation analysis?
? 對變量的相關性進行分析,從而衡量變量之間的相關程度
? 保留相關性較弱的變量?
4、聚類分析
? Clustering analysis?
? 將變量按照相似程度劃分類型,使得同類變量之間的相似性比其他的更強