'userdefinedfunction' 태그의 글 목록

userdefinedfunction

2020. 2. 27. 18:33

spark scala dataframe을 withColumn을 통해 한줄한줄 iteration을 돌려 처리가 가능하다.
내가 원하는 함수에 한개의 row를 넘기고, 그 처리된 결과를 새로운 column으로 생성한다.

sampleFunc을 생성하고 UserDefinedFunction, udf를 통해 sampleUdf를 생성
생성된 sampleUdf는 DataFrame의 withColumn을 이용
- 첫번째 파라미터는 withColumn을 통해 생성될 신규 컬럼명
- 두번째 파라미터는 udfFunction + parameters
- 여기서 lit은 constant 값을 넘길때 사용한다.

[Spark] SchemaField nullable state 변경하는 방법 (0)	2020.02.28
[Spark] scala DataFrame 생성하기 for 예제 (0)	2020.02.27
[Spark] Scala joda Datetime 사용하는 방법 (+예제코드) - Days, DateTimeFormat, DateTime (0)	2020.02.27
[Spark] 시작할때 살펴보면 좋은 유용한 사이트 모음 (0)	2020.02.27
[Spark] Scala Test (Library, Sbt Test) (0)	2020.02.26

PREV 1 NEXT