12天的第三天 OpenAI 重磅发布soro视频生成 网站火到崩溃
在工作流方面,Sora 的编辑功能是其与其他竞品的最大差异之一。例如,在 Remix 功能中,用户可以通过自然语言提示词轻松编辑视频,并利用「strength(强度)」选项和滑块,精确控制生成内容的变化程度。
- **ChatGPT Plus(20 美元/月)**:提供 **50 个优先视频额度**(即 1000 积分),支持最高 **720p 分辨率** 和 **5 秒时长**的视频生成。
- **ChatGPT Pro(200 美元/月)**:提供 **最多 500 个优先视频额度**(即 10000 积分),支持 **最高 1080p 分辨率**、**20 秒时长**,并且可以同时进行 **5 个并发生成**,此外还支持 **无水印输出**。
这两种订阅计划能够根据用户需求提供不同级别的视频生成能力和灵活度。
目前,**Sora** 暂时不支持 **ChatGPT Team**、**Enterprise** 和 **Edu** 用户,同时也不向 **18 岁以下** 的用户开放。现阶段,用户可以在 **所有 ChatGPT 可用的地区**
Marques Brownlee 在提前一周使用 Sora 后分享了他的使用体验,并指出了这款产品的一些局限性,尤其是在 物理模拟 和 动作表现 上。
他提到,Sora 在物体运动的理解上仍然存在问题,导致视频生成的动作显得不自然。常见的短板包括:
- 动作不自然:尤其是在涉及到 腿部运动 的对象时,生成的动作往往出现前后腿位置混乱的情况。这使得人物或动物的动作看起来不真实。
- 物体突然消失:在一些场景中,物体的突然消失或不连贯的运动也是常见问题,影响了整体流畅感。
这些问题表明,Sora 在处理复杂的物理动态和细节方面还存在一定的技术瓶颈,尤其是在模拟更为复杂的生物运动时,模型的表现尚不完美。
尽管如此,Marques 也表示,这些局限并不妨碍 Sora 在一些场景下展现出其 专业级的创作能力,尤其是在处理静态和较为简单的运动时,生成的视频效果已经非常出色,能够满足高水平的创作需求。
Sora 在 风景镜头 处理方面表现尤为出色,能够生成媲美 专业素材 的 无人机航拍镜头,展现了极高的细节还原和自然光影效果,令人印象深刻。这使得它在需要宏大景观或精细细节的场景中表现尤为突出,适合制作风景类、纪录片或电影素材。
此外,Sora 在 卡通风格 和 定格动画风格 的生成上也有不小的突破,虽然在细节上可能还存在一定的差距,但总体来说,能够呈现出富有艺术感的创意效果。这使得它成为制作 风格化内容、动画短片 或 艺术风格视频 的一个有力工具,能够为创作者提供多样化的表达手段。
总的来说,Sora 虽然在动态物理模拟和文字生成方面仍面临一些挑战,但在处理 静态风景 和 风格化创作 上已展现出显著的优势,尤其适合那些寻求独特视觉效果的项目。
不少网友在第一时间体验了 Sora。例如,网友 @bennash 在尝试生成一个视频时,渲染了 22 分钟仍未成功,且该网站一度停止了注册和登录功能。博主 @nickfloats 评价称,尽管在图像转换为视频时部分特定的视觉特效未能保留,但整体转换效果“清晰且令人满意”。
此外,Sora System Card 也列出了一些值得关注的细节。OpenAI 官方认为,Sora 为理解和模拟现实世界的模型奠定了基础,是实现通用人工智能(AGI)的一项重要里程碑。官方博客指出,Sora 是一种扩散模型,它从一段看似静态噪声的基础视频开始,通过逐步去噪转换为最终的视频。通过同时处理多个帧,模型成功解决了一个难题:即使目标暂时脱离视野,视频中的目标依然保持一致。
与 GPT 模型类似,Sora 采用了 Transformer 架构。
Sora 采用了 DALL·E 3 中的标注技术,该技术为视觉训练数据生成高度描述性的标签,从而使模型能够更准确地根据用户的文本指令生成视频内容。
除了仅通过文本指令生成视频外,Sora 还可以从现有的静态图像生成视频,精确地将图像内容动画化,并保留细节。
为了确保 Sora 的安全部署,OpenAI 在基于 DALL·E 的 ChatGPT 和 API 部署中的安全经验基础上,进一步强化了安全防护措施。
具体安全措施包括:
- 严禁未经授权使用他人肖像,以及禁止描绘真实未成年人的内容;
- 禁止生成非法内容或侵犯知识产权的作品;
- 禁止生成有害内容,如未经同意的亲密影像、用于欺凌、骚扰或诽谤的内容,或任何旨在传播暴力、仇恨或造成他人痛苦的作品;
- 严禁创建和传播用于欺诈、诈骗或误导他人的内容。
此外,所有 Sora 生成的视频都附带 C2PA 元数据,用于标识视频的来源,提高透明度,并支持源验证。
与此前因真实人像问题而备受关注的 Flux 不同,Sora 对上传包含人物的内容设定了更严格的审核标准,目前该功能仅对少量早期测试者开放。
大半年前,初试啼声的 Sora 赢得了广泛的赞誉。然而,若说一年前我们还能对着一系列演示 demo 高喊“现实不存在了”,那么在国内外各类视频生成模型的轮番涌现下,我们的胃口早已被“喂刁”,同类产品再难打动我们。
这种态度的转变,源于一个简单的事实:当 AI 从“勉强可用”迈向“真正可用”的阶段,用户的期待也随之升级,焦点不再是“能否做到”,而是“做得多好”。
幸运的是,Sora 并未在掌声中止步。通过与艺术家的深度合作,他们在工作流程方面做出了显著改进。功能如 Re-cut、Remix 和 Storyboard 等,都极大提升了实用性,展现了 Sora 在细节上的进步和突破。
甲乙方的存在决定了工作流中沟通的持续需求,而 AI 的价值在于提升这种沟通的效率。Sora 的真正意义不在于它能做什么,而在于它让创作者从繁琐的技术细节中解放出来,回归创意的本质。
与此同时,上周引发广泛讨论的 200 美元 ChatGPT Pro 订阅计划,如今已具备了更合理的价格定位,该计划不仅支持无限制访问 Sora,还带来了强大的产品协同效应。这种结合预计将激发更多超出预期的应用场景和商业价值。
眼下,用户的真金白银永远是最直接的信号。可灵 AI 已交出千万级月流水的亮眼成绩单,证明了这一领域的巨大潜力。对于仍处于“烧钱”阶段的 OpenAI 来说,Sora 有望成为继 ChatGPT 后,另一个“下金蛋”的母鸡。
当 Sora 从“能用”到“好用”,再到“妙用”,或许在不久的未来,我们会发现,真正“不存在”的,或许不是现实,而是人类创造力的极限。