InfoSphere DataStage是IBM統(tǒng)一數(shù)據(jù)集成平臺InfoSphere Information Server(IIS) 的重要組件,是業(yè)界主流的 ETL(Extract, Transform, Load) 工具。DataStage執(zhí)行從源系統(tǒng)到目標系統(tǒng)的批量和實時的數(shù)據(jù)轉(zhuǎn)換和移動,它廣泛支持各種異構(gòu)平臺的數(shù)據(jù)源和各種類型的數(shù)據(jù)格式(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù));通過簡單易用的圖形化設(shè)計方式,并內(nèi)置豐富的功能組件,從而支持從簡單到高度復(fù)雜的數(shù)據(jù)結(jié)構(gòu)中,對大量數(shù)據(jù)進行收集、清洗、整合和轉(zhuǎn)換,具有滿足苛刻的數(shù)據(jù)集成需求所需的功能性、靈活性和可伸縮性。本課程主要介紹InfoSphere DataStage的基本架構(gòu)和產(chǎn)品特點,并基于實戰(zhàn)案例詳細講解DataStage的安裝、配置、開發(fā)以及較佳實踐。
第一部份 IBM數(shù)據(jù)集成與治理方案簡介
第二部份 Infosphere Datastage 架構(gòu)、安裝與配置
第三部份 Infosphere Datastage 管理與開發(fā)部署流程
第四部份 Infosphere Datastage 數(shù)據(jù)連接組件使用
第五部份 Infosphere Datastage 數(shù)據(jù)合并、排序與聚合組件使用
第六部份 Infosphere Datastage 數(shù)據(jù)轉(zhuǎn)換組件使用
第七部份 Infosphere Datastage 自定義公共組件與過程
第八部份 Infosphere Datastage 作業(yè)序列和作業(yè)控制
第九部份 Infosphere Datastage 作業(yè)調(diào)試、調(diào)度與監(jiān)控
第十部份 Infosphere Datastage 數(shù)據(jù)血源分析
第十一部份 Infosphere Datastage 性能調(diào)優(yōu)和較佳實踐
第十二部份 Infosphere Datastage 實戰(zhàn)案例分享