NVIDIA GPU Driver
컴퓨터의 운영 체제(OS)가 물리적인 NVIDIA GPU 하드웨어와 통신하고 제어할 수 있도록 해주는 번역기
주요 기능
- 하드웨어 제어
- GPU 연산 명령을 GPU 하드웨어에 전달하는 역할
- GPU 상태를 운영체제에 보고하는 역할
- 성능 최적화
- GPU 기능을 최대한 활용할 수 있도록 최적화된 성능을 제공
- 호환성
- 특정 GPU 모델과 운영 체제 버전 간의 호환성을 보장
- CUDA (Compute Unified Device Architecture) 지원
- NVIDIA GPU의 병렬 컴퓨팅 플랫폼 지원
NVIDIA GPU Container Toolkit
컨테이너 환경(Docker,containerd 등)에서 GPU를 활용할 수 있도록 해주는 도구 모음
컨테이너 내부에서 실행되는 애플리케이션이 호스트 시스템에 설치된 GPU 드라이버와 GPU 하드웨어에 접근할 수 있도록 중간 다리 역할
주요 기능
- GPU 장치 노출 (자동 마운트)
- 컨테이너가 실행될 때 호스트 시스템의 GPU 장치 파일과 필요한 NVIDIA 라이브러리를 컨테이너 내부로 자동으로 마운트해 주는 역할
- 컨테이너 런타임 통합
- Docker, containerd와 같은 컨테이너 런타임이 GPU를 인식하고 컨테이너에 할당할 수 있도록 확장 기능 제공
- CUDA 런타임 제공
- 컨테이너 내부에서 CUDA 기반 애플리케이션을 정상적으로 실행할 수 있도록 CUDA 런타임 라이브러리를 준비해주는 역할
NVIDIA GPU Operator
Kubernetes 클러스터 내에서 NIVIDA GPU 소프트웨어 스택 배포, 구성 및 수명 주기 관리를 자동화해주는 Kubernetes Operator
주요 기능