본문 바로가기

JUST DO IT!

검색하기
JUST DO IT!
프로필사진 sunhokimDev

  • 분류 전체보기 (67)
    • TIL (66)
    • 코딩테스트 (1)
    • 토이 프로젝트 (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • k8s
  • Kafka
  • Spark 실습
  • 데이터 파이프라인
  • colab
  • 빅데이터
  • topic
  • Spark SQL
  • Dag
  • spark executor memory
  • SQL
  • Speculative Execution
  • Docker
  • KDT_TIL
  • etl
  • AQE
  • CI/CD
  • Spark
  • Spark Partitioning
  • redshift
  • DataFrame Hint
  • disk spill
  • aws
  • backfill
  • off heap memory
  • Salting
  • Airflow
  • Spark Caching
  • Kubernetes
  • mysql
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록disk spill (1)

JUST DO IT!

Spark 기능과 스케줄링, 메모리 구성 알아보기 - TIL230724

📚 KDT WEEK 17 DAY 1 TIL Spark 기타 기능 Spark 리소스 할당 방식(리소스 스케줄링) Spark Executor 메모리 구성 🟥 Spark 기타 기능 1. Broadcast Variable 룩업 테이블등을 브로드캐스팅하여 셔플링을 막는 방식 (브로드캐스트 조인과 비슷) 모든 노드에 큰 규모의 Input Dataset을 효과적인 방법으로 줄 때 사용한다. 룩업 or 디멘션 테이블(10-20MB의 작은 테이블)을 Executor로 전송하는데 사용 spark.sparkContext.broadcast로 호출 룩업 테이블(파일)을 UDF로 보내는 방법 Closure : UDF안에서 파이썬 데이터 구조를 사용하는 경우 > Task 단위의 Serialization BroadCast : UDF..

TIL 2023. 7. 25. 01:56
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바