圖數據庫和庫
理解圖形數據
圖形作為數據結構
使用頂點(點)和邊(線)來模擬真實場景
使用圖形數據庫建模、持久化、處理圖形數據
本地圖形算法/遍歷
neo4j、OrientDB、Titan
練習:使用neo4j建模圖形數據
白板數據建模
基于圖形數據庫:圖形計算
理解屬性圖
圖形建模不同場景(軟件圖、討論圖、概念圖)
用遍歷解決實際問題
算法/定向遍歷圖形
確定循環的依賴性
案例研究:排名討論貢獻者
按貢獻討論的數量和深度排名
關于情緒和概念分析的說明
圖形計算:本地內存圖形工具包
圖形分析和可視化
JUNG、NetworkX、iGraph
練習:使用NetworkX建模圖形數據
使用NetworkX為一個復雜系統建模
圖形計算:批處理圖形框架
利用Hadoop進行存儲(HDFS)和處理(MapReduce)
迭代算法概述
Hama、Giraph、GraphLab
圖形計算:圖形并行計算
在單個系統中統一ETL,進行探索性分析和迭代圖形計算
GraphX
設置和安裝
Hadoop和Spark
GraphX運算符
屬性、結構、連接、鄰域聚合、緩存和未緩存
使用Pregel API迭代
傳遞發送、接收、計算的參數
構建圖形
在RDD或磁盤上使用頂點和邊
設計可擴展算法
GraphX優化
訪問其他算法
PageRank、連通組件、三角計數
練習:網頁排名和熱門用戶
使用文本文件作為輸入來構建和處理圖形數據
部署到生產 |