Google Cloud ha presentado Veo, un modelo de generación de video, e Imagen 3, una herramienta avanzada de generación de imágenes, en su plataforma Vertex AI. Veo, actualmente en vista previa privada, permite a las empresas crear videos de alta calidad a partir de textos o imágenes, reduciendo significativamente el tiempo y los costos de producción.
Según Google, "Veo permite a las empresas generar videos de alta calidad de manera fácil a partir de simples textos o imágenes." Esto posiciona a Google como el primer hyperscaler en ofrecer un modelo de imagen a video, ayudando a las empresas a transformar activos creativos en visuales atractivos.
Imagen 3, ahora disponible públicamente, ofrece generación de imágenes fotorealistas con mayor detalle y menos artefactos visuales. Incluye herramientas de edición y opciones de personalización, lo que permite a las empresas adaptar los resultados a las especificaciones de su marca.
Grandes empresas como Mondelez International y WPP están aprovechando estas herramientas para acelerar la creación de contenido. Mondelez planea utilizar Veo para la producción de videos, mientras que WPP integra estas tecnologías en su plataforma impulsada por IA, WPP Open.
Paralelamente, la herramienta de OpenAI para convertir texto en video, Sora, recientemente ganó atención debido a una filtración en Hugging Face, donde su API se volvió brevemente accesible. OpenAI rápidamente restringió el acceso después de que un alto tráfico causara problemas en el servidor.
La competencia en el espacio de generación de video con IA se intensifica, con herramientas como Gen-3 Alpha de Runway y Movie Gen de Meta surgiendo. Mientras tanto, empresas chinas como Kuaishou y Tencent también están lanzando potentes modelos de generación de video, ampliando el panorama competitivo.