GPU: paga por uso para trabajo de IA
Levanta GPUs T4, A100 o H100 desde RunPod. Conecta por SSH, ejecuta tu modelo, detén el pod. Paga por segundo.
Lo que hace
Las GPUs reales son raras en laptops, caras en workstations y excesivas el 95% del tiempo. La capa GPU de CelDrive te permite levantar una solo cuando la necesitas: para entrenamiento, inferencia, generación de imagen / video, o cualquier otra cosa que quiera núcleos CUDA reales.
celdrive gpu start --type T4|A100|H100 aprovisiona un pod RunPod con una imagen PyTorch (CUDA, cuDNN, PyTorch, transformers, diffusers, todo preinstalado) y devuelve credenciales SSH. Desde ahí te conectas por SSH como cualquier otra caja Linux y ejecutas tu carga de trabajo, o usa celdrive gpu run <cmd> para trabajos one-shot que envían tu directorio actual, ejecutan y traen los resultados de vuelta.
Los pods arrancan en 60–90 segundos. El estado es efímero: cuando detienes el pod, el disco se va con él. Lo que quieras conservar va de regreso a tu carpeta CelDrive, que el pod tiene montada automáticamente.
Niveles de precio
Tarifas community-cloud de RunPod, obtenidas en vivo por el CLI al inicio de la sesión. Facturado por segundo: sin mínimo mensual, sin suscripción inactiva. Detén el pod en el momento en que termines.
| GPU | VRAM | ~Precio | Mejor para |
|---|---|---|---|
| T4 | 16 GB | ~$0.39/h | Stable Diffusion, Whisper, modelos Llama pequeños, dev / iteración |
| A100 80 GB | 80 GB | ~$1.89/h | Inferencia de Llama-3 70B, fine-tuning de Mistral, entrenamiento serio |
| H100 80 GB | 80 GB | ~$3.49/h | Entrenamiento / fine-tuning de modelos frontier, el menor tiempo posible |
La facturación por segundo es el modelo real de RunPod: un trabajo de 23 minutos en T4 cuesta ~$0.15, no una hora completa. Si arrancas un pod y lo detienes después de 90 segundos porque algo no funcionó, debes ~$0.01.
Para qué lo usarías
- Stable Diffusion: genera a velocidad completa sin una tarjeta NVIDIA local; funciona bien en T4, más rápido en A100
- Inferencia Llama-3 / Mistral / Mixtral: A100 80 GB cabe Llama-3 70B cómodamente; T4 maneja modelos 7-8B
- Transcripción Whisper: audio de muchas horas en minutos en una T4
- Fine-tuning de modelos pequeños a medianos: LoRAs y fine-tunes completos en modelos clase 7B-30B
- Transcodificación de video: NVENC en una T4 mastica h264 / h265 / AV1
- Renderizado 3D: Blender Cycles / OptiX acelerado; más barato que las render farms para tomas únicas
Honesto sobre el ajuste de modelos: no intentes ejecutar modelos a escala frontier (clase GPT-4, 175B+) en una T4. No caben y serían insoportablemente lentos si cupieran. Empareja la GPU con la carga de trabajo: T4 para dev e inferencia de modelos pequeños, A100 para trabajo serio, H100 cuando el tiempo de pared vale más que la tarifa por hora.
El flujo
Tres comandos, misma forma que cómputo. La salida es real, la facturación es real.
→ solicitando pod community (T4 16GB, imagen PyTorch)...
✓ pod listo en 73s · $0.39/h · facturado por segundo
ssh: ssh celdrive-gpu (auto-configurado)
$ celdrive gpu run "python train.py"
→ subiendo cwd...
→ ejecutando en T4...
Epoch 1/10 loss=0.412 acc=0.873 [00:42]
Epoch 2/10 loss=0.301 acc=0.911 [00:39]
...
→ trayendo salida (model.pt, logs/)...
$ celdrive gpu stop
✓ pod terminado · facturado 23 min · $0.15
El panel expone los mismos controles: panel GPU → elige un tipo → Iniciar sesión → la información SSH aparece. El costo en vivo sube mientras el pod corre así que ves exactamente lo que la sesión está gastando.
Configuración a tener en cuenta
celdrive gpu start devuelve payment_required con un enlace para recargar tu cuenta de RunPod.
Esta es una restricción real de RunPod, no algo que añadamos nosotros. Podríamos adelantar el crédito y facturarte encima, pero eso añade un margen y una superficie de facturación que preferimos no tener. Es el mismo arreglo que RunPod tiene con todos los demás que usan su API. Es una configuración de cinco minutos, una sola vez. Almacenamiento, memoria y cómputo no se ven afectados.
Si prefieres no lidiar con RunPod directamente, el panel te guía a través de la recarga la primera vez que haces clic en Iniciar sesión en el panel GPU.