目錄
模塊架構(gòu)

spark-arch-01.png
集群架構(gòu)

spark-arch-02.png
Master/Slave
Driver/Cluster Manager/Work
Driver控制節(jié)點
Cluster Manager集群資源管理器
Work工作節(jié)點
運行流程
構(gòu)建Spark Application運行環(huán)境 即由任務(wù)Driver控制節(jié)點創(chuàng)建SparkContext
SparkContext根據(jù)RDD的依賴關(guān)系構(gòu)建DAG(Directed Acyclic Graph)
DAG調(diào)度器(DAGScheduler)將DAG分解成多個階段(Stage) 每個階段都是一個任務(wù)集(TaskSets)
DAG調(diào)度器(DAGScheduler)通過Cluster Manger將任務(wù)(Task)調(diào)度到Executor上執(zhí)行
任務(wù)(Task)在Executor上執(zhí)行 運行完畢后釋放所有資源