ollama37/docker/docker-compose.yml

version: "3.8"

services:
  ollama:
    image: ollama37:latest
    container_name: ollama37
    runtime: nvidia
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    ports:
      - "11434:11434"
    volumes:
      - ollama-data:/root/.ollama
    environment:
      - OLLAMA_HOST=0.0.0.0:11434
      - NVIDIA_VISIBLE_DEVICES=all
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "/usr/local/bin/ollama", "list"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 5s

volumes:
  ollama-data:
    name: ollama-data