Google Cloud a dévoilé Veo, un modèle de génération vidéo, et Imagen 3, un outil avancé de génération d'images, sur sa plateforme Vertex AI. Veo, actuellement en aperçu privé, permet aux entreprises de créer des vidéos de haute qualité à partir de textes ou d'images, réduisant ainsi considérablement le temps et les coûts de production.
Selon Google, "Veo permet aux entreprises de générer facilement des vidéos de haute qualité à partir de simples textes ou images." Cela positionne Google comme le premier hyperscaler à offrir un modèle d'image à vidéo, aidant les entreprises à transformer les actifs créatifs en visuels engageants.
Imagen 3, désormais disponible au public, fournit une génération d'images photoréalistes avec un meilleur détail et moins d'artefacts visuels. Il inclut des outils d'édition et des options de personnalisation, permettant aux entreprises d'adapter les résultats aux spécifications de leur marque.
Des entreprises majeures comme Mondelez International et WPP exploitent ces outils pour accélérer la création de contenu. Mondelez prévoit d'utiliser Veo pour la production vidéo, tandis que WPP intègre ces technologies dans sa plateforme alimentée par l'IA, WPP Open.
Parallèlement, l'outil de génération vidéo de texte d'OpenAI, Sora, a récemment attiré l'attention en raison d'une fuite sur Hugging Face, où son API est devenue brièvement accessible. OpenAI a rapidement restreint l'accès après que des problèmes de serveur aient été causés par un trafic élevé.
La concurrence dans l'espace de génération vidéo IA s'intensifie, avec des outils comme Gen-3 Alpha de Runway et Movie Gen de Meta qui émergent. Pendant ce temps, des entreprises chinoises comme Kuaishou et Tencent lancent également des modèles de génération vidéo puissants, renforçant le paysage concurrentiel.