Entorno y reproducibilidad
gpu-gate
Espera una GPU libre, la reclama y ejecuta tu comando.
Instalación
pip install gpu-gateUna vez publicado en PyPI. También disponible ya desde GitHub:
pip install git+https://github.com/jmweb-org/gpu-gateQué hace
En una máquina con varias GPUs compartidas y sin scheduler, lanzar un job es vigilar nvidia-smi, elegir tarjeta a mano y exportar la variable. gpu-gate es ese bucle de esperar, elegir, exportar y ejecutar, con un lock cooperativo.
Características
- —Selección por memoria libre y utilización.
- —Lock cooperativo para no pisar la misma tarjeta.
- —Exporta CUDA_VISIBLE_DEVICES y ejecuta.
- —Sin demonio ni servidor; exit codes honestos.