본문 바로가기

JUST DO IT!

검색하기
JUST DO IT!
프로필사진 sunhokimDev

  • 분류 전체보기 (67)
    • TIL (66)
    • 코딩테스트 (1)
    • 토이 프로젝트 (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Tags
  • CI/CD
  • redshift
  • SQL
  • 빅데이터
  • KDT_TIL
  • Kafka
  • 데이터 파이프라인
  • AQE
  • Spark 실습
  • topic
  • Spark
  • off heap memory
  • backfill
  • DataFrame Hint
  • spark executor memory
  • Spark Caching
  • k8s
  • Airflow
  • Dag
  • aws
  • etl
  • mysql
  • Salting
  • colab
  • Spark Partitioning
  • Spark SQL
  • Kubernetes
  • disk spill
  • Docker
  • Speculative Execution
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록start_date (1)

JUST DO IT!

Airflow Backfill - TIL230608

📚 KDT WEEK 10 DAY 4 TIL Airflow Backfill 🟥 Backfill 과거에 읽어온 데이터들의 문제가 발생했거나 실패한 데이터 파이프라인을 재실행하는 것 Full Refresh 방식의 경우 다시 재실행하면 그만이지만, Incremental Update 방식에서 중요한 수단이다. Backfill을 알기 전에 알아야할 중요한 요소가 있다. DAG를 만들면서 지정해주던 날짜 변수인 start_date는 DAG의 처음 실행 날짜와는 다르다. 만약 Daily Incremental Update(매일 새로운 데이터 적재) 방식으로 ETL을 구성했다면, start_date가 2023-06-01 이라고 지정했을 때, 처음 DAG가 실행되는 날짜는 2023-06-02가 된다. start_date는 ..

TIL 2023. 6. 8. 23:07
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바