'trait' 태그의 글 목록 :: 더블리의 12층

trait

[Spark] SparkSessionWrapper를 구현하자 2020.02.26

[Spark] SparkSessionWrapper를 구현하자

2020. 2. 26. 18:40

SparkSessionWrapper

SparkSessionWrapper를 생성하는 이유는 SparkSession을 시작/중지하는 비용이 크기 때문에
SparkSession을 하나 생성해서 빠르게 코드 수행이 가능하다.

	package com.github.direcision

	import org.apache.spark.sql.SparkSession

	trait SparkSessionWrapper {

	lazy val spark: SparkSession = {
	SparkSession
	.builder()
	.master("local")
	.appName("spark app")
	.getOrCreate()
	}

	}

view raw SparkSessionWrapper.scala hosted with ❤ by GitHub

trait은 java에서 interface를 생각하면 된다. 사용하기 위해서는 with를 통해 확장이 가능하다.
여기서 lazy를 사용하는 이유는 정의된 spark의 변수가 처음 사용될때 코드가 실행되도록
- that a val is executed when it is defined
- a lazy val is executed when it is accessed the first time.
getOrCreate의 메소드는 SparkSession이 있으면 가져오고, 없으면 새로 생성하는 메소드

Lazy Example

	scala> val x = { println("x"); 15 }
	x
	x: Int = 15

	scala> lazy val y = { println("y"); 13 }
	y: Int = <lazy>

	scala> x
	res2: Int = 15

	scala> y
	y
	res3: Int = 13

	scala> y
	res4: Int = 13

view raw lazy_example.scala hosted with ❤ by GitHub

저작자표시 비영리 변경금지

'우리는 개발자 > Data Engineering' 카테고리의 다른 글

[Spark] 시작할때 살펴보면 좋은 유용한 사이트 모음 (0)	2020.02.27
[Spark] Scala Test (Library, Sbt Test) (0)	2020.02.26
[Spark] 자주 사용하는 명령어 모음 (업데이트) (0)	2020.02.26
[Spark] Scala 프로젝트 구성 및 시작하기 (sbt, g8) (0)	2020.02.26
[elasticsearch] es를 intellij 에서 debugging 하기. (0)	2020.02.26

더블리의 12층 doubly 님의 블로그입니다.

PREV 1 NEXT

+ Recent posts

Powered by Tistory, Designed by wallel

티스토리툴바