spark通過maven操作redis

一、maven環(huán)境下添加操作redis的jar包及源碼包

1、下載jar包 redis的jar包下載地址(需要翻墻)

2、手動(dòng)把jar包添加到maven庫中,參考方法如下:

maven手動(dòng)把本地jar安裝到本地倉庫(windows\ mac)

是自己編寫的一個(gè)jar文件,每次添加單個(gè)jar到maven本地倉庫的操作如下:

1)建立一個(gè)新的文件夾,將jar文件存放在該文件夾下。注意文件夾路徑為英文名且最好只存放該文件。

2)在該文件夾下建立一個(gè)pom.xml文件,在pom文件中定義其maven坐標(biāo)。

3)在windows cmd窗口中執(zhí)行以下命令:?

mvn install:install-file -Dfile=<path-to-file> -DgroupId=<group-id> -DartifactId=<artifact-id> -Dversion=<version> -Dpackaging=<packaging>

例如:

mvn install:install-file? -Dfile=D:/jar/xxx.jar? -DgroupId=xxx.xxx? -DartifactId=xxx -Dversion=x.x -Dpackaging=jar

4)舉個(gè)mac os環(huán)境下的例子,后面的參數(shù)具體根據(jù)情況需要進(jìn)行添加

示例:mvn install:install-file -Dfile=/Users/softwareAndRoad/softwaredata/data/myself/jar/spark-redis-2.3.0.jar -DgroupId=RedisLabs -DartifactId=spark-redis -Dversion=2.3.0 -Dpackaging=jar

5)idea中添加spark-redis源碼

下載redis的源碼包zip包,按如下步驟進(jìn)行添加

步驟一:在idea的項(xiàng)目中選中左上角的File--->Project Structure

步驟二、選擇spark-redis-2.3.0-source.zip源碼包

步驟三:點(diǎn)擊ok

3、maven庫中添加依賴

<dependency>

? ? ? <groupId>RedisLabs</groupId>

? ? ? <artifactId>spark-redis</artifactId>

? ? ? <version>2.3.0</version>

? ? </dependency>

二、spark讀取redis操作示例

4、操作redis

1)讀取

import com.redislabs.provider.redis._

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.spark.rdd.RDD

object RedisRead {

? def main(args: Array[String]): Unit = {

? ? var conf: SparkConf = new SparkConf().setAppName("RedisRead")

? ? conf.set("redis.host","redis地址")

? ? conf.set("redis.port","redis端口號(hào)")//端口好,默認(rèn)為6379

? ? conf.set("redis.auth","redis密碼")? //用戶權(quán)限配置

? ? val sc = new SparkContext(conf)

? ? val redisKeys: RDD[(String, String)] = sc.fromRedisKV("TEST_K_V")//TEST_K_V為redis中已存在的String類型的key

? ? println("總個(gè)數(shù):"+redisKeys.count())

? ? redisKeys.foreach(map=>{

? ? ? println(map.toString())

? ? })

? ? sc.stop()

? }

}

三、打成jar包

5、打包需要的jar包

commons-pool2-2.4.2.jar/

jedis-2.9.0.jar/

spark-core_2.11-2.3.1.jar/

spark-redis-2.3.0.jar/

項(xiàng)目名稱的jar包

四、提交到集群并查看結(jié)果

6、提交到集群

spark-submit --master yarn --driver-memory 2g --executor-memory 4g? --executor-cores 4 --num-executors 3? --conf spark.sqluffle.partitions=40 --class com.test.opRedis.RedisRead? Redis.jar

7、查看結(jié)果

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容