El primer vídeo que generé con Sora fue una taza de café humeando sobre una mesa de madera, con luz de ventana lateral. Cinco segundos. El resultado tenía una calidad visual que, sacado de contexto, podría pasar por una toma real de cámara lenta. El segundo intento fue más ambicioso: una persona caminando por una calle mojada bajo la lluvia. Aquí aparecieron los primeros problemas: la figura humana se distorsionaba ligeramente al girar, y el reflejo del suelo, aunque impresionante, no respondía del todo bien a la física real del agua. Ese contraste entre lo que Sora hace excepcionalmente bien y donde todavía falla resume perfectamente el estado actual de la herramienta.
Sora es el generador de vídeo con IA de OpenAI, disponible desde finales de 2024 para suscriptores de ChatGPT Plus y Pro. En un sector que ha evolucionado a una velocidad vertiginosa, Sora destaca por la coherencia temporal de sus generaciones —es decir, por mantener la consistencia visual entre fotogramas, el talón de Aquiles histórico de todos los generadores de vídeo con IA— y por su capacidad para simular, con más precisión que sus competidores, el comportamiento de la luz y las texturas en movimiento.
Cómo funciona Sora: los tres modos de generación
Texto a vídeo
El modo más directo. Describes en lenguaje natural la escena que quieres y Sora genera un clip de hasta 20 segundos en el plan Plus o hasta 60 segundos en el plan Pro. La calidad del prompt tiene el mismo impacto determinante que en los generadores de imagen: una descripción vaga produce resultados genéricos; una descripción precisa que especifique tipo de plano, movimiento de cámara, iluminación y atmósfera produce resultados directamente usables.
Un ejemplo de la diferencia: "a dog running in a park" genera algo perfectamente funcional pero sin personalidad. "A golden retriever running in slow motion through an autumn park, leaves falling, low angle tracking shot, warm afternoon backlight, cinematic depth of field" genera algo que parece sacado de un anuncio de alta producción. El vocabulario cinematográfico aplicado a los prompts de texto —tipos de plano, movimientos de cámara, condiciones de luz— es la habilidad que más rápidamente mejora los resultados.
Imagen a vídeo
Partes de una imagen estática y Sora la anima generando el movimiento que describe el prompt. Este modo tiene aplicaciones muy concretas en diseño y marketing: tomar una fotografía de producto y animarla con movimiento de cámara, convertir una ilustración en un clip animado o dar vida a un retrato con un movimiento sutil. En mis pruebas, los mejores resultados en este modo se obtienen con imágenes que tienen un sujeto claro y un fondo relativamente simple. Las composiciones muy cargadas de elementos tienden a producir distorsiones en los bordes.
Vídeo a vídeo
El modo más avanzado permite usar un vídeo existente como base y modificarlo: cambiar el estilo visual (transformar una escena real en animación, aplicar una estética cinematográfica concreta), extender su duración o alterar elementos específicos manteniendo el movimiento original. Este modo está en desarrollo activo y es donde la herramienta muestra más variabilidad en los resultados, pero también donde las posibilidades creativas son más amplias para producción y postproducción.
Lo que Sora hace bien y donde todavía falla
| Aspecto | Rendimiento | Observación práctica |
|---|---|---|
| Coherencia entre fotogramas | ⭐⭐⭐⭐⭐ | Mejor del sector. Los objetos mantienen forma y posición a lo largo del clip. |
| Calidad de iluminación y texturas | ⭐⭐⭐⭐⭐ | Simulación de luz muy convincente, especialmente en interiores y al atardecer. |
| Movimientos de cámara | ⭐⭐⭐⭐ | Travellings, zooms y planos estáticos funcionan bien. Los movimientos erráticos o no convencionales producen resultados más variables. |
| Figuras humanas en movimiento | ⭐⭐⭐ | Aceptable para planos medios y alejados. Distorsiones visibles en primer plano, especialmente en manos y expresiones faciales durante el movimiento. |
| Física de líquidos y fluidos | ⭐⭐⭐ | Convincente en planos cerrados (café, lluvia suave). Poco realista en masas de agua grandes o fluidos en movimiento rápido. |
| Texto legible en pantalla | ⭐ | No fiable. El texto aparece distorsionado o cambia entre fotogramas. Para vídeos que requieran texto, hay que añadirlo en postproducción. |
Sora frente a sus competidores directos
El mercado de generación de vídeo con IA es el que más rápido evoluciona en 2026. Sora no es la única opción y, dependiendo del caso de uso, tampoco siempre la mejor:
| Herramienta | Punto fuerte | Limitación principal | Precio base |
|---|---|---|---|
| Sora | Coherencia temporal, calidad cinematográfica | Figuras humanas, texto en vídeo | Incluido en ChatGPT Plus (20 $/mes) |
| Runway Gen-3 | Control preciso de cámara, edición avanzada | Coste elevado por segundo generado | Desde 15 $/mes |
| Kling AI | Movimiento de personas, relación calidad-precio | Interfaz menos intuitiva, acceso variable | Plan gratuito disponible |
| Luma Dream Machine | Velocidad de generación, plan gratuito generoso | Calidad inferior a Sora en composiciones complejas | Plan gratuito disponible |
Acceso y planes: qué incluye cada suscripción
Sora está integrado en ChatGPT y el acceso varía según el plan. Con ChatGPT Plus (20 dólares al mes) tienes acceso a generaciones de hasta 20 segundos en resolución 720p, con un número de créditos mensuales de vídeo que se agota con el uso intensivo. Con ChatGPT Pro (200 dólares al mes) el límite sube a 60 segundos, la resolución alcanza 1080p y los créditos son considerablemente más amplios para uso profesional continuado.
Un aspecto importante para proyectos comerciales: OpenAI permite el uso comercial de los vídeos generados con Sora, pero los términos de servicio incluyen restricciones sobre contenido de personas reales, marcas y material protegido por copyright. Antes de usar un vídeo generado en una campaña o proyecto de cliente, conviene revisar las condiciones actualizadas en la documentación oficial.
Preguntas frecuentes sobre Sora
¿Sora está disponible en España y Latinoamérica?
Sí, Sora está disponible en la mayoría de países donde ChatGPT opera, incluyendo España y los principales países de Latinoamérica. El acceso se gestiona directamente desde la interfaz de ChatGPT sin necesidad de configuración adicional. Algunos países con restricciones de acceso a ChatGPT también tienen limitado el acceso a Sora.
¿Puedo usar vídeos generados con Sora para proyectos comerciales?
OpenAI permite el uso comercial de los vídeos generados con planes de pago, pero con condiciones específicas: no puedes representar personas reales sin su consentimiento, usar marcas registradas o generar contenido que infrinja derechos de autor. Para proyectos de cliente o uso en publicidad, revisa los términos de servicio actualizados antes de entregarlo, ya que OpenAI actualiza sus políticas con frecuencia.
¿Cuánto tarda Sora en generar un vídeo?
Depende de la duración y resolución del clip. En mis pruebas, clips de 5 segundos en 720p tardan entre 1 y 3 minutos. Los clips más largos (20 segundos en 1080p) pueden tardar entre 5 y 10 minutos en momentos de alta demanda del servidor. Sora no genera en tiempo real: el proceso ocurre en la nube y los tiempos varían según la carga de los servidores de OpenAI, que suele ser mayor en horario laboral europeo y norteamericano.
¿Sora puede generar vídeo con audio o música?
En la versión actual integrada en ChatGPT, Sora genera vídeo sin audio. Los clips se entregan como archivos de vídeo mudos. Para proyectos que requieran audio, es necesario añadirlo en postproducción con herramientas de edición de vídeo externas. OpenAI ha señalado en su hoja de ruta que la generación de audio sincronizado es una funcionalidad en desarrollo.
¿Sora es mejor que Runway para producción profesional?
Depende del tipo de proyecto. Sora tiene ventaja en coherencia visual global y calidad de iluminación. Runway Gen-3 ofrece más herramientas de control preciso de cámara, funciones de edición por región y un ecosistema de postproducción más desarrollado para flujos de trabajo profesionales. Para prototipado rápido de ideas visuales, Sora es más accesible. Para producción de contenido donde el control frame a frame importa, Runway sigue siendo la referencia para muchos profesionales.
¿Qué pasa con los vídeos generados si cancelo mi suscripción?
Los vídeos que ya hayas descargado permanecen en tu dispositivo sin ninguna restricción. Los que estén almacenados únicamente en la galería de Sora dentro de ChatGPT pueden dejar de ser accesibles si tu plan expira. La práctica recomendada es descargar y guardar localmente cualquier vídeo que vayas a usar, independientemente de si planeas mantener la suscripción activa.
Meta-descripción: Sora de OpenAI analizado en profundidad: modos de generación, qué hace bien, dónde falla, comparativa con Runway y Kling, y cómo sacarle partido real.