
生物數據分析技能培訓
核酸信息注釋
NCBI數據庫:Gene(參考序列)、Unigene(標準參考序列)、Nucleotide(非參考序列)數據庫。
EBI數據庫:HGNC(標準全稱/縮寫識別、轉換)、Expression Atlas(表達圖譜)子數據庫。
核酸信息注釋
基因結構數據庫:內含子剪切位點、可變剪接、啟動子序列及分析策略、轉錄因子及其結合位點。
蛋白質信息注釋
蛋白質序列數據庫:UniProt數據庫。
蛋白質相互作用數據庫:String數據庫。
蛋白質三級結構數據庫:PDB數據庫。
功能注釋數據庫:GO、KEGG數據庫。
非編碼RNA信息注釋及靶點分析
非編碼RNA注釋、靶點預測、驗證靶點、功能及疾病關聯等數據庫。
1.miRNA:miRBase、TargetScan、miRTarBase、miRPath、miRDB等數據庫。
2.LncRNA:NONCODE、LNCipedia、lncRNAdb、LncBase等數據庫。
3.CircRNA:circBase、starBase、CircInteractome等數據庫。
表達數據挖掘與聚類分析
利用GEO2R在線工具進行GEO數據挖掘。
先利用ArrayTools軟件處理從GEO數據庫下載的表達數據,再利用Cluster/Treeview軟件進行聚類分析。
利用UALCAN在線工具進行TCGA數據挖掘。
基因集共表達分析
基因集共表達分析策略。
利用DAVID在線工具進行基因集功能富集分析(GO、KEGG Pathway),并利用Excel軟件/Venn在線工具繪制富集圖/維恩圖。
利用bioDBnet在線工具轉換基因集ID。
基因集相互作用圖形化分析。
交互作用數據可視化分析
利用Cytoscape軟件進行關聯基因注釋及其交互關系、分子間相互作用、基因集差異表達、基因集共表達的可視化分析。