我测试了Openai Sora，在这里我发现的东西-人工智能-PHP中文网

Openai在其“ Openai的12天”系列的第3天正式发布了Sora 。自2024年4月首次宣布以来几个月的悬念之后，索拉（Sora）证明自己是AI生成的视频内容空间的巨大飞跃。 Openai发布了Sora Turbo模型，这是原始Sora型号的高端加速版。让我们看一下新添加的功能，然后尝试一下！

我们给您的节日礼物：Sora在这里。 https://t.co/uhdmyughtt pic.twitter.com/ljoruqsfo0
- 2024年12月9日Openai（@Openai）

什么是索拉？
Openai Sora的功能
将Openai Sora进行测试
如何访问Sora？
Openai Sora功能
- 单独的产品
- 视频创建和编辑
- 图像上传和增强
- 主题（预设）
- 纵横比的选择
- 视频持续时间
- 文本和图像集成
- 故事板（高级创作）
- 视频质量和分辨率
Sora的技术基础
Openai Sora的道德考虑
关键要点
结论

什么是索拉？

Sora是一种文本对电视发电机，它利用高级扩散模型和变压器体系结构根据书面描述创建视频。这些视频是通过从噪声开始的，并通过多个步骤逐步完善它来生成。这个扩散过程使该模型可以从广泛的文本输入中产生逼真的连贯的视频序列。

Sora以GPT ， Dall·E和剪辑为基础，在Openai先前的成功基础上，Sora引入了一个重大飞跃，允许用户根据文本提示从头开始创建视频或扩展现有的视频。无论是生成全新的视频还是对图像进行动画化，Sora的能力直接从自然语言中创建视觉引人入胜的叙事都是前所未有的。

Openai Sora的功能

从文本中生成视频：从简单的文本提示中创建视频。
扩展现有视频：继续或修改现有视频。
动画图像：通过动画将静止图像栩栩如生。
处理复杂的场景：保持多个帧的连续性。
比例和适应：以各种格式和长度生成视频。
变换视频：根据文本提示修改现有视频。

关键改进

现实物理：更自然的物体运动。
更长的视频：创建最多20秒的视频。
增强的照明：具有动态照明效果的更具视觉吸引力的视频。

将Openai Sora进行测试

提示：创建有关与小猫一起玩的白狗的视频

提示：在海滩上创建一个舞狗的视频。

故事板提示

迅速的：

生动的动画显示了一种精神分子正在摄入，被描绘成一个小的发光粒子进入口腔。背景是人类消化系统的风格化表示，旋转颜色暗示了复杂的旅程的开始。
该分子在血液中行进，周围是红色和白细胞。它被描述为一个明亮的发光粒子，迅速通过血管网络移动。
该分子到达血脑屏障，被描述为闪闪发光的壁，并穿透它进入大脑。当分子与它们相互作用时，现场变得更加复杂，神经元和突触会照明。

迅速的：

在一个温暖的儿童房间里，一个小男孩和女孩坐在一个舒适的临时蒙古包里，用格子毯子和枕头建造。他们穿着嬉戏的帽子和毡靴，被灯的柔和光芒所包围。孩子们用玩具驯鹿演奏时咯咯笑着，他们的眼睛充满了想象。
孩子们紧紧闭上眼睛，空中的期待感。
当他们睁开眼睛时，他们变成了成年人，站在Yakutia的现代酒店景观前，周围是真正的蒙古包和一个巨大的雪冬场景。

观察：在使用Chatgpt Plus帐户创建视频的同时，我花了很多时间，我看到有很多改进的范围。

如何访问Sora？

Sora可以通过新网站sora.com进行评估。您可以使用ChatGPT计划来访问该模型：

Chatgpt Plus帐户：此计划为您每月50代。这些可能与文本到视频创作的数量或其他每月的其他特定任务有关。
Openai Pro帐户：这提供了以缓慢的队列模式提供的无限一代，再加上每月500个世代相传的速度。该层似乎专注于提供更大的灵活性，可以选择更快地处理任务，而其他任务可能会排队和处理更慢。
可用性：该服务将在启动时提供给英国和欧盟，这可能是由于法律，监管或数据隐私考虑因素（例如GDPR）所致。将来，随着它们扩展到更多地区，将来可以取消这种限制。

Openai Sora功能

我测试了Openai Sora，在这里我发现的东西

单独的产品

Sora是独立产品，未集成到Chatgpt或其他OpenAI平台中。
可通过Sora.com访问，在其中显示最近生成和策划的视频。

视频创建和编辑

从提示下生成视频：用户可以根据文本提示创建视频。
上传图像：用户还可以上传图像，Sora可以用来生成视频。
重新混合功能：允许用户通过描述所需的更改来更改现有视频。
- 力量设置：控制视频将如何改变，并随着更高的设置导致更大的艺术变化。
视频编辑：Sora还可以编辑该工具最初生成的视频。

图像上传和增强

我测试了Openai Sora，在这里我发现的东西

上传图像：您可以从上传图像开始以创建视频。此图像可以用作基础，您可以通过进一步的元素，文本或动画扩展它。
文本描述：您还可以用文本描述图像。您的描述越详细，视频创建就越具体遵循您的说明。对于不太详细的描述，该工具将以一般的创造力和细节来填补空白。

主题（预设）

我测试了Openai Sora，在这里我发现的东西

Sora提供了各种预设，可用于定义视频的整体主题。一些示例包括：
- 气球世界：这个预设可能会营造出异想天开或梦幻般的氛围。
- 停止运动：一种旨在模仿定格动画风格的预设，使您的视频逐框，手工制作的外观。

纵横比的选择

您可以为视频选择纵横比。一些常见选项包括：
- 16：9 （宽屏幕）：非常适合大多数视频，尤其是YouTube，宽屏电影等。
- 1：1 （Square）：适用于Instagram等社交媒体帖子。
- 9:16 （垂直）：非常适合Tiktok或Instagram故事等平台。

视频持续时间

我测试了Openai Sora，在这里我发现的东西

您可以将视频的持续时间设置为最多20秒，从而为包含多少内容提供灵活性。

文本和图像集成

该平台允许将文本和图像结合起来以进行创造性表达：
- 通过上传图像来创建：您上传图像以作为视频的基础，然后将其扩展或使用其他内容进行动画。
- 基于文本的创建：您可以使用文本描述场景或图像。文本越具体，视频越遵循您的方向。例如，详细的描述将指导视频以复制您提到的确切元素。

故事板（高级创作）

我测试了Openai Sora，在这里我发现的东西

对于更复杂的视频项目，情节板模式使您可以按时间轴指导视频创建。这提供了：
- 控制顺序：您可以定义元素（文本，图像和视频）的顺序。
- 高级编辑：它允许对场景进行更精确的调整和测序。
- 多媒体集成：您可以组合图像，文本和视频剪辑来创建叙事或复杂的视觉故事。

视频质量和分辨率

我测试了Openai Sora，在这里我发现的东西

分辨率选项：生成最高1080p分辨率的视频。
- 与480p相比，1080p录像的生成时间更长，这是最快的选择。
- 720p需要4倍超过480p。
- 480p是最快的。
平均发电时间：1080p视频（按用户需求和流量）进行几分钟。

简而言之

Sora是一个具有强大自定义选项的灵活，用户友好的视频创建平台。你可以：

上传图像或用文本描述场景。
从各种主题预设中进行选择，例如气球世界或停止运动。
控制纵横比和视频持续时间。
使用故事板模式进行高级视频编辑和排序。

这种功能的组合使用户可以轻松创建引人入胜的专业视频，即使具有最少的技术知识。

这些功能将Sora概述为一种功能强大但仍然具有不可思议的工具，用于生成创意视频内容，尤其是针对非遗嘱认证，风格化的项目。

Sora的技术基础

Sora从根本上建立在扩散模型上，该技术始于随机噪声，并迭代地将其完善成连贯的视频。此过程反映了传统的图像到图像扩散模型的工作方式，但视频序列的复杂性增加。

Sora创新的关键是将基于补丁的表示形式用于图像和视频。与GPT中的令牌类似，Sora中的视频和图像被分解为较小的数据“补丁”。这使该模型能够更有效地处理大型和复杂的视觉数据，从而能够在各种持续时间和分辨率上生成视频。

此外，Sora建立在DALL·E 3中使用的重新启动技术的基础上，从而使其能够为其培训数据生成高度描述性的字幕。此功能使该模型能够密切关注文本提示，从而导致视频忠于用户说明，并且与输入描述更加一致。

另请阅读：什么是Openai的Sora扩散变压器（DIT）？

Openai Sora的道德考虑

这是Sora希望您做的事情：

同意：仅上传媒体以明确的许可，并确保18岁以下的媒体有适当的同意。
暴力和明确主题：不要上传描述暴力，明确主题或成人材料的内容。
媒体权利：确保您拥有上传所共享媒体的必要所有权或权利。
后果：通过违反这些规则滥用平台可能会导致暂停或禁止未退款。

关键要点

Openai's Sora是一种文本对电视发电机，具有主题，情节板模式和最高1080p的分辨率之类的功能。但是，它具有明显的局限性。视频在20秒钟内被封顶，这可能不适合更长的叙述。与较低的分辨率相比，高分辨率渲染（例如1080p）是耗时的，速度放缓的。目前，由于监管问题，SORA在英国/欧盟不可用，从而限制了访问权限。此外，道德准则限制了用法和违规风险暂停风险。索拉（Sora）强大，但仍在发展，并提供了改进技术和可访问性的空间。同样，发电速度非常慢，这是由于高分辨率视频所致。但是我希望随着OpenAI继续优化模型及其基础架构，它将随着时间的推移而改善。未来的更新可能会带来更快的生成速度，而不会损害高分辨率视频的质量，从而使过程更有效和用户友好。