GPU: paga por uso para trabajo de IA

Levanta GPUs T4, A100 o H100 desde RunPod. Conecta por SSH, ejecuta tu modelo, detén el pod. Paga por segundo.

T4 · A100 · H100 Facturación por segundo PyTorch listo Plan Pro en adelante

Lo que hace

Las GPUs reales son raras en laptops, caras en workstations y excesivas el 95% del tiempo. La capa GPU de CelDrive te permite levantar una solo cuando la necesitas: para entrenamiento, inferencia, generación de imagen / video, o cualquier otra cosa que quiera núcleos CUDA reales.

celdrive gpu start --type T4|A100|H100 aprovisiona un pod RunPod con una imagen PyTorch (CUDA, cuDNN, PyTorch, transformers, diffusers, todo preinstalado) y devuelve credenciales SSH. Desde ahí te conectas por SSH como cualquier otra caja Linux y ejecutas tu carga de trabajo, o usa celdrive gpu run <cmd> para trabajos one-shot que envían tu directorio actual, ejecutan y traen los resultados de vuelta.

Los pods arrancan en 60–90 segundos. El estado es efímero: cuando detienes el pod, el disco se va con él. Lo que quieras conservar va de regreso a tu carpeta CelDrive, que el pod tiene montada automáticamente.

Niveles de precio

Tarifas community-cloud de RunPod, obtenidas en vivo por el CLI al inicio de la sesión. Facturado por segundo: sin mínimo mensual, sin suscripción inactiva. Detén el pod en el momento en que termines.

GPU	VRAM	~Precio	Mejor para
T4	16 GB	~$0.39/h	Stable Diffusion, Whisper, modelos Llama pequeños, dev / iteración
A100 80 GB	80 GB	~$1.89/h	Inferencia de Llama-3 70B, fine-tuning de Mistral, entrenamiento serio
H100 80 GB	80 GB	~$3.49/h	Entrenamiento / fine-tuning de modelos frontier, el menor tiempo posible

La facturación por segundo es el modelo real de RunPod: un trabajo de 23 minutos en T4 cuesta ~$0.15, no una hora completa. Si arrancas un pod y lo detienes después de 90 segundos porque algo no funcionó, debes ~$0.01.

Para qué lo usarías

Stable Diffusion: genera a velocidad completa sin una tarjeta NVIDIA local; funciona bien en T4, más rápido en A100
Inferencia Llama-3 / Mistral / Mixtral: A100 80 GB cabe Llama-3 70B cómodamente; T4 maneja modelos 7-8B
Transcripción Whisper: audio de muchas horas en minutos en una T4
Fine-tuning de modelos pequeños a medianos: LoRAs y fine-tunes completos en modelos clase 7B-30B
Transcodificación de video: NVENC en una T4 mastica h264 / h265 / AV1
Renderizado 3D: Blender Cycles / OptiX acelerado; más barato que las render farms para tomas únicas

Honesto sobre el ajuste de modelos: no intentes ejecutar modelos a escala frontier (clase GPT-4, 175B+) en una T4. No caben y serían insoportablemente lentos si cupieran. Empareja la GPU con la carga de trabajo: T4 para dev e inferencia de modelos pequeños, A100 para trabajo serio, H100 cuando el tiempo de pared vale más que la tarifa por hora.

El flujo

Tres comandos, misma forma que cómputo. La salida es real, la facturación es real.

$ celdrive gpu start --type T4
→ solicitando pod community (T4 16GB, imagen PyTorch)...
✓ pod listo en 73s · $0.39/h · facturado por segundo
ssh: ssh celdrive-gpu (auto-configurado)

$ celdrive gpu run "python train.py"
→ subiendo cwd...
→ ejecutando en T4...
Epoch 1/10 loss=0.412 acc=0.873 [00:42]
Epoch 2/10 loss=0.301 acc=0.911 [00:39]
...
→ trayendo salida (model.pt, logs/)...

$ celdrive gpu stop
✓ pod terminado · facturado 23 min · $0.15

El panel expone los mismos controles: panel GPU → elige un tipo → Iniciar sesión → la información SSH aparece. El costo en vivo sube mientras el pod corre así que ves exactamente lo que la sesión está gastando.

Configuración a tener en cuenta

RunPod requiere un saldo de crédito de $10 antes de que los pods arranquen. Esto es una recarga única, no una suscripción. Tu crédito se drena mientras usas GPUs y solo recargas cuando se termina. Sin él, celdrive gpu start devuelve payment_required con un enlace para recargar tu cuenta de RunPod.

Esta es una restricción real de RunPod, no algo que añadamos nosotros. Podríamos adelantar el crédito y facturarte encima, pero eso añade un margen y una superficie de facturación que preferimos no tener. Es el mismo arreglo que RunPod tiene con todos los demás que usan su API. Es una configuración de cinco minutos, una sola vez. Almacenamiento, memoria y cómputo no se ven afectados.

Si prefieres no lidiar con RunPod directamente, el panel te guía a través de la recarga la primera vez que haces clic en Iniciar sesión en el panel GPU.

GPU: paga por uso para trabajo de IA

Lo que hace

Niveles de precio

Para qué lo usarías

El flujo

Configuración a tener en cuenta

Pruébalo gratis