DATA GROUND 로고DATA GROUND

#MLOps 태그

#MLOps 태그가 포함된 글을 모았습니다.

Kubernetes2024-04-09

[Kubernetes] DaemonSet이란 무엇인가

Kubernetes DaemonSet의 개념과 사용 목적, 적용 순서, 주의사항을 예제 YAML과 함께 정리합니다.

#Kubernetes#DaemonSet#컨테이너#클러스터운영#MLOps
DevOps2024-04-08

[Airflow] 특정 에러만 retry 처리하는 방법

Apache Airflow에서 특정 예외(Exception)에 대해서만 재시도를 수행하는 방법을 PythonOperator와 on_retry_callback 기준으로 정리합니다.

#Airflow#Retry#에러처리#KubernetesPodOperator#MLOps#DevOps
DevOps2024-03-20

[Prometheus] Container & Node Metric Query 정리

Kubernetes 환경에서 Container와 Node 단위의 CPU, Memory, GPU 메트릭을 수집하기 위한 Prometheus 쿼리 정리. cAdvisor, node-exporter, dcgm-exporter 기반 실무용 PromQL 모음.

#Kubernetes#Prometheus#Monitoring#PromQL#Container#Node#MLOps