nvidia mig1 Kubernetes GPU Operator(Nvidia gpu, Mig, Extended resources) - 어떻게 GPU 리소스 낭비 없이 Pod를 잘 배포할까? 쿠버네티스는 장치 플러그인 프레임워크를 통해 NVIDIA GPU와 같은 특수 하드웨어 자원에 대한 액세스를 제공하지만, 이러한 하드웨어 자원이 탑재된 노드를 구성하고 관리하는 것은 다수의 소프트웨어 구성 요소(드라이버, 컨테이너 런타임, 라이브러리 등)의 설정이 필요하며 오류가 발생하기 쉽다. 수동 설치 (Manual Install) 왼쪽의 "Manual Install" 부분은 개별 구성 요소들을 수동으로 설치해야 하는 과정을 보여준다. 이 방식에서는 리눅스 배포판 위에 NVIDIA 드라이버를 먼저 설치하고, 그 위에 NVIDIA 런타임을 설치한다. 이후에 쿠버네티스를 설치하고, 마지막으로 NVIDIA 디바이스 플러그인과 모니터링 도구를 설치한다. 일부 구성 요소는 베어 메탈 서버에 직접 설치해야 하며,.. 2024. 2. 14. 이전 1 다음