OpenAI发布Sora 2:AI视频与音频生成迎来革新,iOS应用同步上线

编辑者: Veronika Radoslavskaya

OpenAI于今日正式发布了Sora 2,标志着人工智能在生成逼真视频和同步音频内容方面迈出了重要一步。这款先进的模型在2024年2月推出的初代Sora基础上,显著提升了物理准确性、真实感和可控性。Sora 2能够更精确地模拟物理世界,克服了早期模型中物体变形不真实的局限。例如,它能准确展示篮球弹跳反弹的物理过程,而非直接进入篮筐。

Sora 2在生成复杂场景方面表现出色,能够模拟奥运体操的精妙动作或花样滑冰运动员在空中旋转跳跃的场景。除了视觉上的真实感,Sora 2在生成高度逼真的复杂背景音景、语音和音效方面也表现突出,并能与视频内容实现精准同步。伴随此次技术升级,OpenAI还推出了全新的Sora应用,现已登陆iOS设备,将AI视频创作体验转变为一种社交和协作模式。用户可以在可定制的动态消息流中创建、混剪和发现视频。

Sora应用的一项亮点功能是“Cameos”(化身),允许用户在完成一次性的视频和音频录制以验证身份后,将自己经过验证的形象插入任何Sora生成的场景中。此功能旨在促进更深层次的社交连接,OpenAI内部的早期测试表明,它已帮助员工建立了新的联系。为应对潜在的担忧,如信息孤立、成瘾及低质量内容的传播,OpenAI实施了多项安全措施。公司正在扩大人工审核团队规模,以审查欺凌等问题内容,并通过ChatGPT推出了家长控制功能。为平衡个性化与安全性,用户在创建个性化Cameos时必须进行身份验证。

为实现更广泛的访问,Sora应用初期将在美国和加拿大推出,并计划迅速扩展至其他国家。Sora 2模型最初将免费提供,并设有慷慨的额度限制。同时,ChatGPT Pro用户将能够使用Sora 2 Pro的实验性、更高质量模型。Sora 2及其相关应用的发布,标志着AI驱动的多媒体创作演进中的一个关键时刻,为创意表达开辟了新的途径,并凸显了复杂AI工具日益融入消费者产品,重塑数字内容格局。Sora 2能够生成长达16秒的视频片段,极大地扩展了叙事可能性,并提高了帧的连贯性,确保物体和人物在多镜头场景中移动和保持一致性。此外,Sora 2生成的同步音频,包括语音和音效,与视频内容完美匹配,进一步增强了真实感。该模型在写实、电影感和动漫风格方面表现出色。Sora应用本身也提供了一种社交体验,用户可以创建、混剪和发现视频,并使用“Cameos”功能将自己或朋友的形象置于AI生成的场景中。OpenAI正在通过邀请制逐步推出Sora 2的访问权限,并计划迅速扩展到其他国家。为了应对潜在的滥用,Sora 2生成的所有视频都将包含可见水印和C2PA元数据,以区分AI内容,并提供家长控制和内容审核等安全措施。OpenAI还在探索将Sora 2集成到API中,并保持Sora 1 Turbo的可用性,以满足更广泛用户的需求。

来源

  • NBC News

  • OpenAI Releases Sora 2: Advanced AI Video and Audio Generation App

  • OpenAI Is Preparing to Launch a Social App for AI-Generated Videos

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。