linux spark分布式集群搭建圖文詳解

一.前期準(zhǔn)備

1.1 Win7官網(wǎng)下載spark包

本文使用版本spark-1.6.2-bin-hadoop2.6.tgz

1.2 配置jdk

jdk1.7:linux jdk安裝和配置

scala2.10.6:linux scala安裝和配置

hadoop-2.6.5:hadoop分布式集群搭建

1.3 centos7集群服務(wù)器

主機(jī)名 ? ?系統(tǒng) ? ? ? ? ?IP地址

master ? ?centos7 ? ?192.168.32.128

slave01 ? centos7 ? ?192.168.32.131

slave02 ? centos7 ? ? 192.168.32.132

二.spark完全分布式集群搭建

以下操作只針對(duì)master主機(jī)服務(wù)器,其他主機(jī)服務(wù)器類似。

2.1 上傳spark包至 /opt/software目錄

2.2 解壓和拷貝spark至 /usr/local/spark

cd /opt/software

tar -zxvf spark-1.6.2-bin-hadoop2.6.tgz

cp -r spark-1.6.2-bin-hadoop2.6 /usr/local/spark

spark解壓和拷貝

spark解壓和拷貝完成

三.spark完全分布式集群配置

3.1 系統(tǒng)文件profile配置

配置系統(tǒng)環(huán)境變量

vi /etc/profile

系統(tǒng)環(huán)境配置

退出保存,重啟配置

source /etc/profile

3.2 文件配置

定位:cd /usr/local/spark/conf

默認(rèn):

log4j.properties.template,spark-env.sh.template,slaves.template,spark-defaults.conf.template

復(fù)制:

log4j.properties,spark-env.sh,slaves,spark-defaults.conf

配置文件生成

3.3 修改spark-env.sh文件

vi spark-env.sh

export JAVA_HOME=/usr/local/jdk

export SCALA_HOME=/usr/local/scala

export HADOOP_HOME=/usr/local/hadoop

export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

export SPARK_MASTER_IP=master

export SPARK_WORKER_MEMORY=1G

export SPARK_EXECUTOR_MEMORY=1G

export SPARK_DRIVER_MEMORY=1G

export SPARK_WORKER_CORES=6

spark-env.sh文件

3.4 修改spark-defaults.conf文件

vi spark-defaults.conf

spark.eventLog.enabled? ? ? ? ? true

spark.eventLog.dir? ? ? ? ? ? ? hdfs://master:9000/historyserverforSpark

spark.executor.extraJavaOptions? -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"

spark.yarn.historyServer.address? master:18080

spark.history.fs.logDirectory? ? ? hdfs://master:9000/historyserverforSpark

spark-defaults.conf文件

3.5 修改slaves文件

vi slaves

master

slave01

slave02

slaves文件

3.6 hadoop新建historyserverforSpark目錄

#新建historyserverforSpark目錄

hadoop fs -mkdir /historyserverforSpark

#查看目錄

hadoop fs -ls /

目錄新建和查看

3.7?slave01和slave02服務(wù)器修改

3.7.1 spark文件復(fù)制

復(fù)制master中spark文件到slave01和slave02服務(wù)器的/usr/local目錄

scp -r /usr/local/sparkroot@slave01:/usr/local/spark

scp -r /usr/local/sparkroot@slave012:/usr/local/spark

3.7.2 ?系統(tǒng)環(huán)境profile配置

類似3.1 分別在salve01和slave02配置系統(tǒng)環(huán)境

四.spark集群測(cè)試

4.1 測(cè)試命令

#啟動(dòng)

start-all.sh start

#停止

stop-all.sh start

4.2 集群測(cè)試

在master服務(wù)器運(yùn)行啟動(dòng)命令

進(jìn)入/usr/local/spark目錄

4.2.1 啟動(dòng)各個(gè)節(jié)點(diǎn)

sbin/start-all.sh start

啟動(dòng)節(jié)點(diǎn)

4.2.2 啟動(dòng)start-history-server

sbin/start-history-server.sh

history啟動(dòng)

4.2.3 查看節(jié)點(diǎn)狀態(tài)

jps查看節(jié)點(diǎn)進(jìn)程

master進(jìn)程
slave進(jìn)程

4.2.4 web端驗(yàn)證是否啟動(dòng)成功

通過web端的18080端口查看是否啟動(dòng)成功

http://192.168.32.128:18080

驗(yàn)證啟動(dòng)

4.2.5 通過spark-submit命令運(yùn)行jar包

bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://192.168.32.128:7077 lib/spark-examples-1.6.2-hadoop2.6.0.jar 10

spark-submit測(cè)試


spark應(yīng)用管理
history-server

至此,spark完成分布式集群搭建完畢。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 一、系統(tǒng)參數(shù)配置優(yōu)化 1、系統(tǒng)內(nèi)核參數(shù)優(yōu)化配置 修改文件/etc/sysctl.conf,添加如下配置,然后執(zhí)行s...
    張偉科閱讀 3,935評(píng)論 0 14
  • 環(huán)境準(zhǔn)備 服務(wù)器集群 我用的CentOS-6.6版本的4個(gè)虛擬機(jī),主機(jī)名為hadoop01、hadoop02、ha...
    Flighting拾壹狼閱讀 776評(píng)論 0 1
  • 搭建Spark的單機(jī)版集群 一、創(chuàng)建用戶 useradd spark passwd spark 二、下載軟件 JD...
    葡小萄家的貓閱讀 1,831評(píng)論 0 3
  • 忙一點(diǎn)多好,閑著閑著,就廢掉了! 我現(xiàn)在每天都很閑,閑到不知道要干嘛,還美其名曰:迷茫。 聽著很搞笑,都快要大學(xué)畢...
    軒凌閱讀 360評(píng)論 0 1
  • 2016 網(wǎng)易校招產(chǎn)品崗筆試題 1、copy to China 的例子舉例,至少 5 個(gè) 2、列舉 O2O 例子,...
    愛攝影的奧派閱讀 359評(píng)論 0 0

友情鏈接更多精彩內(nèi)容