我測試了Openai Sora，在這裡我發現的東西-人工智慧-PHP中文網

Openai在其“ Openai的12天”系列的第3天正式發布了Sora 。自2024年4月首次宣布以來幾個月的懸念之後，索拉（Sora）證明自己是AI生成的視頻內容空間的巨大飛躍。 Openai發布了Sora Turbo模型，這是原始Sora型號的高端加速版。讓我們看一下新添加的功能，然後嘗試一下！

我們給您的節日禮物：Sora在這裡。 https://t.co/uhdmyughtt pic.twitter.com/ljoruqsfo0
- 2024年12月9日Openai（@Openai）

什麼是索拉？
Openai Sora的功能
將Openai Sora進行測試
如何訪問Sora？
Openai Sora功能
- 單獨的產品
- 視頻創建和編輯
- 圖像上傳和增強
- 主題（預設）
- 縱橫比的選擇
- 視頻持續時間
- 文本和圖像集成
- 故事板（高級創作）
- 視頻質量和分辨率
Sora的技術基礎
Openai Sora的道德考慮
關鍵要點
結論

什麼是索拉？

Sora是一種文本對電視發電機，它利用高級擴散模型和變壓器體系結構根據書面描述創建視頻。這些視頻是通過從噪聲開始的，並通過多個步驟逐步完善它來生成。這個擴散過程使該模型可以從廣泛的文本輸入中產生逼真的連貫的視頻序列。

Sora以GPT ， Dall·E和剪輯為基礎，在Openai先前的成功基礎上，Sora引入了一個重大飛躍，允許用戶根據文本提示從頭開始創建視頻或擴展現有的視頻。無論是生成全新的視頻還是對圖像進行動畫化，Sora的能力直接從自然語言中創建視覺引人入勝的敘事都是前所未有的。

Openai Sora的功能

從文本中生成視頻：從簡單的文本提示中創建視頻。
擴展現有視頻：繼續或修改現有視頻。
動畫圖像：通過動畫將靜止圖像栩栩如生。
處理複雜的場景：保持多個幀的連續性。
比例和適應：以各種格式和長度生成視頻。
變換視頻：根據文本提示修改現有視頻。

關鍵改進

現實物理：更自然的物體運動。
更長的視頻：創建最多20秒的視頻。
增強的照明：具有動態照明效果的更具視覺吸引力的視頻。

將Openai Sora進行測試

提示：創建有關與小貓一起玩的白狗的視頻

提示：在海灘上創建一個舞狗的視頻。

故事板提示

迅速的：

生動的動畫顯示了一種精神分子正在攝入，被描繪成一個小的發光粒子進入口腔。背景是人類消化系統的風格化表示，旋轉顏色暗示了複雜的旅程的開始。
該分子在血液中行進，周圍是紅色和白細胞。它被描述為一個明亮的發光粒子，迅速通過血管網絡移動。
該分子到達血腦屏障，被描述為閃閃發光的壁，並穿透它進入大腦。當分子與它們相互作用時，現場變得更加複雜，神經元和突觸會照明。

迅速的：

在一個溫暖的兒童房間裡，一個小男孩和女孩坐在一個舒適的臨時蒙古包裡，用格子毯子和枕頭建造。他們穿著嬉戲的帽子和氈靴，被燈的柔和光芒所包圍。孩子們用玩具馴鹿演奏時咯咯笑著，他們的眼睛充滿了想像。
孩子們緊緊閉上眼睛，空中的期待感。
當他們睜開眼睛時，他們變成了成年人，站在Yakutia的現代酒店景觀前，周圍是真正的蒙古包和一個巨大的雪冬場景。

觀察：在使用Chatgpt Plus帳戶創建視頻的同時，我花了很多時間，我看到有很多改進的範圍。

如何訪問Sora？

Sora可以通過新網站sora.com進行評估。您可以使用ChatGPT計劃來訪問該模型：

Chatgpt Plus帳戶：此計劃為您每月50代。這些可能與文本到視頻創作的數量或其他每月的其他特定任務有關。
Openai Pro帳戶：這提供了以緩慢的隊列模式提供的無限一代，再加上每月500個世代相傳的速度。該層似乎專注於提供更大的靈活性，可以選擇更快地處理任務，而其他任務可能會排隊和處理更慢。
可用性：該服務將在啟動時提供給英國和歐盟，這可能是由於法律，監管或數據隱私考慮因素（例如GDPR）所致。將來，隨著它們擴展到更多地區，將來可以取消這種限制。

Openai Sora功能

我測試了Openai Sora，在這裡我發現的東西

單獨的產品

Sora是獨立產品，未集成到Chatgpt或其他OpenAI平台中。
可通過Sora.com訪問，在其中顯示最近生成和策劃的視頻。

視頻創建和編輯

從提示下生成視頻：用戶可以根據文本提示創建視頻。
上傳圖像：用戶還可以上傳圖像，Sora可以用來生成視頻。
重新混合功能：允許用戶通過描述所需的更改來更改現有視頻。
- 力量設置：控制視頻將如何改變，並隨著更高的設置導致更大的藝術變化。
視頻編輯：Sora還可以編輯該工具最初生成的視頻。

圖像上傳和增強

我測試了Openai Sora，在這裡我發現的東西

上傳圖像：您可以從上傳圖像開始以創建視頻。此圖像可以用作基礎，您可以通過進一步的元素，文本或動畫擴展它。
文本描述：您還可以用文本描述圖像。您的描述越詳細，視頻創建就越具體遵循您的說明。對於不太詳細的描述，該工具將以一般的創造力和細節來填補空白。

主題（預設）

我測試了Openai Sora，在這裡我發現的東西

Sora提供了各種預設，可用於定義視頻的整體主題。一些示例包括：
- 氣球世界：這個預設可能會營造出異想天開或夢幻般的氛圍。
- 停止運動：一種旨在模仿定格動畫風格的預設，使您的視頻逐框，手工製作的外觀。

縱橫比的選擇

您可以為視頻選擇縱橫比。一些常見選項包括：
- 16：9 （寬屏幕）：非常適合大多數視頻，尤其是YouTube，寬屏電影等。
- 1：1 （Square）：適用於Instagram等社交媒體帖子。
- 9:16 （垂直）：非常適合Tiktok或Instagram故事等平台。

視頻持續時間

我測試了Openai Sora，在這裡我發現的東西

您可以將視頻的持續時間設置為最多20秒，從而為包含多少內容提供靈活性。

文本和圖像集成

該平台允許將文本和圖像結合起來以進行創造性表達：
- 通過上傳圖像來創建：您上傳圖像以作為視頻的基礎，然後將其擴展或使用其他內容進行動畫。
- 基於文本的創建：您可以使用文本描述場景或圖像。文本越具體，視頻越遵循您的方向。例如，詳細的描述將指導視頻以復制您提到的確切元素。

故事板（高級創作）

我測試了Openai Sora，在這裡我發現的東西

對於更複雜的視頻項目，情節板模式使您可以按時間軸指導視頻創建。這提供了：
- 控制順序：您可以定義元素（文本，圖像和視頻）的順序。
- 高級編輯：它允許對場景進行更精確的調整和測序。
- 多媒體集成：您可以組合圖像，文本和視頻剪輯來創建敘事或複雜的視覺故事。

視頻質量和分辨率

我測試了Openai Sora，在這裡我發現的東西

分辨率選項：生成最高1080p分辨率的視頻。
- 與480p相比，1080p錄像的生成時間更長，這是最快的選擇。
- 720p需要4倍超過480p。
- 480p是最快的。
平均發電時間：1080p視頻（按用戶需求和流量）進行幾分鐘。

簡而言之

Sora是一個具有強大自定義選項的靈活，用戶友好的視頻創建平台。你可以：

上傳圖像或用文本描述場景。
從各種主題預設中進行選擇，例如氣球世界或停止運動。
控制縱橫比和視頻持續時間。
使用故事板模式進行高級視頻編輯和排序。

這種功能的組合使用戶可以輕鬆創建引人入勝的專業視頻，即使具有最少的技術知識。

這些功能將Sora概述為一種功能強大但仍然具有不可思議的工具，用於生成創意視頻內容，尤其是針對非遺囑認證，風格化的項目。

Sora的技術基礎

Sora從根本上建立在擴散模型上，該技術始於隨機噪聲，並迭代地將其完善成連貫的視頻。此過程反映了傳統的圖像到圖像擴散模型的工作方式，但視頻序列的複雜性增加。

Sora創新的關鍵是將基於補丁的表示形式用於圖像和視頻。與GPT中的令牌類似，Sora中的視頻和圖像被分解為較小的數據“補丁”。這使該模型能夠更有效地處理大型和復雜的視覺數據，從而能夠在各種持續時間和分辨率上生成視頻。

此外，Sora建立在DALL·E 3中使用的重新啟動技術的基礎上，從而使其能夠為其培訓數據生成高度描述性的字幕。此功能使該模型能夠密切關注文本提示，從而導致視頻忠於用戶說明，並且與輸入描述更加一致。

另請閱讀：什麼是Openai的Sora擴散變壓器（DIT）？

Openai Sora的道德考慮

這是Sora希望您做的事情：

同意：僅上傳媒體以明確的許可，並確保18歲以下的媒體有適當的同意。
暴力和明確主題：不要上傳描述暴力，明確主題或成人材料的內容。
媒體權利：確保您擁有上傳所共享媒體的必要所有權或權利。
後果：通過違反這些規則濫用平台可能會導致暫停或禁止未退款。

關鍵要點

Openai's Sora是一種文本對電視發電機，具有主題，情節板模式和最高1080p的分辨率之類的功能。但是，它具有明顯的局限性。視頻在20秒鐘內被封頂，這可能不適合更長的敘述。與較低的分辨率相比，高分辨率渲染（例如1080p）是耗時的，速度放緩的。目前，由於監管問題，SORA在英國/歐盟不可用，從而限制了訪問權限。此外，道德準則限制了用法和違規風險暫停風險。索拉（Sora）強大，但仍在發展，並提供了改進技術和可訪問性的空間。同樣，發電速度非常慢，這是由於高分辨率視頻所致。但是我希望隨著OpenAI繼續優化模型及其基礎架構，它將隨著時間的推移而改善。未來的更新可能會帶來更快的生成速度，而不會損害高分辨率視頻的質量，從而使過程更有效和用戶友好。