12天的第三天 OpenAI 重磅发布soro视频生成网站火到崩溃

直播回放双字幕

OpenAI 在 X 平台宣布，自 2 月以来，他们一直在开发 Sora Turbo，这是一款速度显著提升的模型版本。今天，Sora Turbo 已作为独立产品向 Plus 和 Pro 用户开放。

有趣的是，由于 Sora 的热度过高，大量用户涌入体验网站，导致网站一度崩溃，注册和登录功能暂停。面对服务问题，Altman 频繁在 X 平台安抚用户：“由于需求超出预期，我们将暂时关闭新用户注册，并且生成内容的速度可能会有所延迟。我们正在全力解决！”

Sora 界面大揭秘，六大神级功能上线，让你告别剪辑学习？？

类似于 Midjourney，Sora 也拥有独立的用户界面，用户不仅可以整理和浏览生成的视频，还能查看其他用户的提示词和精选作品。

在 Sora 的「Library」中，用户可以保存喜欢或有用的提示词，方便日后使用。保存的提示词不仅可以随时查看或修改，对于需要重复创作相似内容的用户来说，极大提高了创作效率。

在工作流方面，Sora 的编辑功能是其与其他竞品的最大差异之一。例如，在 Remix 功能中，用户可以通过自然语言提示词轻松编辑视频，并利用「strength（强度）」选项和滑块，精确控制生成内容的变化程度。

Re-cut 功能能够智能识别最佳画面，并支持场景的无缝延伸，用户可以轻松调整视频的展示方式，扩展或裁剪画面，提升创作的灵活性和精准度。

Storyboard（故事板）功能类似于传统的视频编辑器，允许用户将多个提示词串联在一起，生成连续的长视频。通过这一功能，用户能够轻松处理复杂的多步骤场景，精确控制视频的每个片段，实现更流畅、更连贯的创作效果。

借助 **Loop** 和 **Blend** 功能，用户可以创作无缝循环的视频，完美融合不同片段，实现自然过渡。而 **Style presets** 功能提供一系列预设风格，帮助用户轻松调整视频的视觉效果，节省时间并提升创作效率。

在技术规格上，Sora 支持生成 5-20 秒的视频，并兼容 1:1、9:16 等主流宽高比。与早期版本相比，Sora 的生成速度显著提升，能够更高效地满足用户需求。

此外，Sora Turbo 采用灵活的积分定价策略，所需积分根据视频的分辨率和持续时间而有所不同。如果您是 ChatGPT Plus 或 Pro 会员，则无需额外付费即可使用该功能。

例如，生成一个 480p 分辨率、5 秒钟的视频需要 25 个积分；而生成一个 480p、20 秒的视频则需要 150 个积分。此外，如果使用 **Re-cut**、**Remix**、**Blend** 或 **Loop** 等功能，并且生成的视频超过了 5 秒钟，则会额外消耗积分。使用时间越长，所需积分越多，因此要注意避免超时，否则也会产生额外费用。

对于订阅用户来说，ChatGPT Plus 和 Pro 计划提供不同的视频生成额度和功能支持：

- **ChatGPT Plus（20 美元/月）**：提供 **50 个优先视频额度**（即 1000 积分），支持最高 **720p 分辨率** 和 **5 秒时长**的视频生成。

- **ChatGPT Pro（200 美元/月）**：提供 **最多 500 个优先视频额度**（即 10000 积分），支持 **最高 1080p 分辨率**、**20 秒时长**，并且可以同时进行 **5 个并发生成**，此外还支持 **无水印输出**。

这两种订阅计划能够根据用户需求提供不同级别的视频生成能力和灵活度。

OpenAI 正在考虑为不同类型的用户推出不同的定价模式，并计划于明年初推出这一新方案。这将可能为不同需求和预算的用户提供更多选择。

目前，**Sora** 暂时不支持 **ChatGPT Team**、**Enterprise** 和 **Edu** 用户，同时也不向 **18 岁以下** 的用户开放。现阶段，用户可以在 **所有 ChatGPT 可用的地区**

实测 Sora 暴露最大短板，但这些场景堪比专业级

Marques Brownlee 在提前一周使用 Sora 后分享了他的使用体验，并指出了这款产品的一些局限性，尤其是在 物理模拟 和 动作表现 上。

他提到，Sora 在物体运动的理解上仍然存在问题，导致视频生成的动作显得不自然。常见的短板包括：

动作不自然：尤其是在涉及到 腿部运动 的对象时，生成的动作往往出现前后腿位置混乱的情况。这使得人物或动物的动作看起来不真实。
物体突然消失：在一些场景中，物体的突然消失或不连贯的运动也是常见问题，影响了整体流畅感。

这些问题表明，Sora 在处理复杂的物理动态和细节方面还存在一定的技术瓶颈，尤其是在模拟更为复杂的生物运动时，模型的表现尚不完美。

尽管如此，Marques 也表示，这些局限并不妨碍 Sora 在一些场景下展现出其 专业级的创作能力，尤其是在处理静态和较为简单的运动时，生成的视频效果已经非常出色，能够满足高水平的创作需求。

Sora 仍然面临一些挑战，尤其是在对物理世界规律的理解上。比如，它的生成效果有时显得不自然，某些视频片段会呈现出 慢动作 效果，而其他部分则以正常速度播放，这种“别扭”的感觉很容易被察觉，说明其在物理模拟方面仍有待改进。此外，Sora 还未能解决 文字生成 的问题，导致经常出现文字混乱，尽管它在某些特定场景（如 新闻主播风格的生成 或 剪辑风格）表现出色，效果非常逼真。这些细节显示，Sora 在某些应用中仍有很强的创作潜力，但仍需进一步优化。

Sora 在 风景镜头 处理方面表现尤为出色，能够生成媲美 专业素材 的 无人机航拍镜头，展现了极高的细节还原和自然光影效果，令人印象深刻。这使得它在需要宏大景观或精细细节的场景中表现尤为突出，适合制作风景类、纪录片或电影素材。

此外，Sora 在 卡通风格 和 定格动画风格 的生成上也有不小的突破，虽然在细节上可能还存在一定的差距，但总体来说，能够呈现出富有艺术感的创意效果。这使得它成为制作 风格化内容、动画短片 或 艺术风格视频 的一个有力工具，能够为创作者提供多样化的表达手段。

总的来说，Sora 虽然在动态物理模拟和文字生成方面仍面临一些挑战，但在处理 静态风景 和 风格化创作 上已展现出显著的优势，尤其适合那些寻求独特视觉效果的项目。

在性能方面，生成一个 5 秒的 360p 视频通常只需约 20 秒。然而，当涉及到 1080p 分辨率或复杂提示词时，生成时间可能会延长至几分钟。随着用户数量的激增，整体生成速度也有所放缓。

不少网友在第一时间体验了 Sora。例如，网友 @bennash 在尝试生成一个视频时，渲染了 22 分钟仍未成功，且该网站一度停止了注册和登录功能。博主 @nickfloats 评价称，尽管在图像转换为视频时部分特定的视觉特效未能保留，但整体转换效果“清晰且令人满意”。

此外，Sora System Card 也列出了一些值得关注的细节。OpenAI 官方认为，Sora 为理解和模拟现实世界的模型奠定了基础，是实现通用人工智能（AGI）的一项重要里程碑。官方博客指出，Sora 是一种扩散模型，它从一段看似静态噪声的基础视频开始，通过逐步去噪转换为最终的视频。通过同时处理多个帧，模型成功解决了一个难题：即使目标暂时脱离视野，视频中的目标依然保持一致。

与 GPT 模型类似，Sora 采用了 Transformer 架构。

Sora 采用了 DALL·E 3 中的标注技术，该技术为视觉训练数据生成高度描述性的标签，从而使模型能够更准确地根据用户的文本指令生成视频内容。

除了仅通过文本指令生成视频外，Sora 还可以从现有的静态图像生成视频，精确地将图像内容动画化，并保留细节。

为了确保 Sora 的安全部署，OpenAI 在基于 DALL·E 的 ChatGPT 和 API 部署中的安全经验基础上，进一步强化了安全防护措施。

具体安全措施包括：