剛剛，OpenAI 王炸 Sora 正式上線！網站火到崩潰，柯曼緊急關閉使用者註冊

2024-12-10心靈

就在剛剛，OpenAI Sora 正式登場。

本次釋出會延續了「短劇」的快節奏風格，全程 20 分鐘左右，由 CEO Sam Altman、Sora 負責人 Bill Peebles 等人主持。

OpenAI 在 X 平台表示，自 2 月份以來，他們一直在構建 Sora Turbo，後者是一個速度明顯更快的模型版本，今天也將其作為獨立產品向 Plus 和 Pro 使用者開放。

有趣的是，由於 Sora 熱度太高，大批使用者湧入體驗網站，導致該網站一度崩潰，停止註冊登入。不給力的服務也讓 Altman 連連在 X 平台安撫使用者：

「由於需求超出預期，我們將不得不間歇性地關閉新使用者註冊，並且生成內容的速度會在一段時間內減慢。我們正在全力以赴！」

附上體驗地址：Sora.com

Sora 界面大揭曉，擁有 6 大神級功能，不用學剪輯了？

類似於 Midjourney 的網頁界面，Sora 同樣擁有自己單獨的使用者介面，使用者使用者不僅能夠整理和瀏覽生成的影片，還能檢視其他使用者的提示和精選內容。

在「Library」功能中，使用者可以保存自己喜歡或有用的提示詞，以便未來使用。並且保存的提示詞可以按需檢視或修改，對於需要重復創作相似內容的使用者，無疑能大大提高效率。

在工作流方面，Sora 的編輯功能是區別於其它競品的重要亮點。

比如說，在 Remix 功能中，使用者可以利用純自然語言提示詞對影片進行編輯，並透過簡單的「strength（強度）」選項和滾軸來控制生成的變化程度。

Re-cut 功能則能智能辨識最佳畫面，並支持向任意方向延伸場景。

Sora 的 Storyboard（故事板）功能則類似於影片編輯器，可以將多個提示詞串聯在一起，生成一個更長的影片，輕松處理復雜的多步驟場景。

搭配 Loop 和 Blend 功能，使用者還能創作出無縫迴圈的影片，並完美融合不同片段，而 style presets 功能則可以預設和調整生成的風格。

在技術規格上，Sora 支持 5-20 秒的影片生成，並相容 1:1、9:16 等主流寬高比。相比早期版本，現在的生成速度有了顯著提升。

另外，還有幾點細節需要註意。

OpenAI 采用了靈活的積分制定價策略，積分數量因分辨率和持續時間而異，如果你早已是 ChatGPT Plus 和 Pro 會員，那就無需額外費用就能使用。

比如生成一個 480p、5s 的影片就需要 25 個積分，如果生成 480p、20s 的影片則需要 150 個積分。

此外，如果你用 Re-cut、Remix、Blend 或者 Loop 這些功能，生成的作品超過了 5 秒鐘，那也得額外扣你的積分，多用多花錢，別超時，超時也花錢。

對於訂閱使用者而言，20 美元的 ChatGPT Plus 計劃提供 50 個優先影片額度（1000積分），支持最高 720p 分辨率和 5 秒時長。

而 200 美元的 ChatGPT Pro 計劃則提供最多 500 個優先影片（10000 個積分），支持 1080p 分辨率、20 秒時長、5 個並行生成和無浮水印輸出。

OpenAI 還在為不同類別的使用者開發不同的定價模式，將於明年初推出。

對了，Sora 暫不支持ChatGPT Team、Enterprise 和 Edu 版本，同時也不向 18 歲以下使用者開放。現階段，使用者可以在所有 ChatGPT 可用的地方存取 Sora，但英國、瑞士和歐盟等地區除外。

實測 Sora 暴露最大短板，但這些場景堪比專業級

知名博主 Marques Brownlee 提前一周用上了 Sora，並在 YouTube 上分享了他的使用體驗。

他指出這款產品仍存在一些局限性。

在物理模擬方面，模型對物體運動的理解還不夠深入，常常出現動作不自然、物體突然消失等問題。特別是在處理帶有腿部運動的物件時，經常出現前後腿位置混亂的情況，導致動作看起來不自然。

又或者，某些影片生成結果看起來像是慢動作，而影片的其他部份則以正常速度播放，肉眼很容易察覺這種「別扭」。簡言之，Sora 還是沒能解決老毛病，缺乏對物理世界規律的理解。

另外，Sora 沒能解決文字生成的問題，導致經常出現文字混亂的現象，而剪輯風格、文字捲軸的運動、新聞主播風格的生成則格外逼真。

不過，Sora 也有不少擅長的場景。

比如說，Sora 在風景鏡頭處理方面表現出色，能生成媲美專業素材的無人機航拍鏡頭，在卡通和定格動畫風格上的表現也差強人意。

效能方面，一個 5 秒的 360p 影片通常能在 20 秒內完成生成。

不過，當涉及 1080p 或復雜提示詞時，生成時間可能會延長到幾分鐘，但隨著如今大批使用者的湧入，生成速度明顯慢了大半拍。

不少網友也在第一時間上手體驗了 Sora。比如網友 @bennash 想生成一個影片，渲染了 22 分鐘都沒能成功，甚至該網站一度停止註冊登入。

博主 @nickfloats 給出的評價是，Sora 在將影像轉換成影片時，雖然某些特定的視覺特效沒有被保留，但整體的轉換效果是「清晰和令人滿意的」。

Sora 能成為 OpenAI 的下一只「金母雞」嗎？

Sora system card 也列出了一些值得關註的細節。

OpenAI 官方認為，Sora 為能夠理解和模擬現實世界的模型提供了基礎，將是實作通用人工智能（AGI）的一項重要裏程碑。

官方網誌中提到，Sora 是一種擴散模型，它透過從一段看起來像靜態雜訊的基礎影片開始，逐步去除雜訊並轉變為最終的影片。透過同時處理多個幀，模型成功解決了一個難題：即使目標暫時脫離視野，也能確保其在影片中始終保持一致。

與 GPT 模型類似，Sora 采用了 Transformer 架構。

Sora 使用 DALL·E 3 中的標註技術，該技術為視覺訓練數據生成高度描述性的標簽。因此，模型能夠更準確地根據使用者的文本指令生成影片內容。

除了能夠僅透過文本指令生成影片外，Sora 還能夠從現有的靜態影像生成影片，準確地將影像內容進行動畫化，並註重細節。該模型還可以從現有的影片中擴充套件或填補缺失的幀。

為了確保安全地部署 Sora，OpenAI 基於 DALL·E 在 ChatGPT 和 API 部署中的安全經驗，以及 OpenAI 其他產品（如 ChatGPT）的安全防護措施進行了強化。

未經他人特許使用他人肖像，並禁止描繪真實未成年人；

建立非法內容或侵犯知識產權的內容；

禁止生成有害內容，例如未經同意的親密影像、用於欺淩、騷擾或誹謗的內容，或旨在傳播暴力、仇恨或使他人痛苦的內容；

建立並傳播用於欺詐、詐騙或誤導他人的內容。

所有 Sora 生成的影片都帶有 C2PA 後設資料，這些後設資料能夠標識影片的來源是 Sora，從而提高透明度，並可用於驗證其來源。

與此前憑借真實人像出圈的 Flux 不同，Sora 們對上傳包含人物的內容設定了特別嚴格的稽核標準，目前僅作為試點功能提供給少量早期測試者，並遮蔽含有裸露的內容。

大半年前，初試啼聲的 Sora 贏得互聯網一片喝彩。

然而，如果說一年前尚未還能對著一群演示 demo 空喊「現實不存在了」，那麽在國內外各類影片模型的輪番洗禮之下，我們早已養刁的胃口很難再被同樣的產品打動。

這種態度的轉變源於一個簡單的事實。

當 AI 要從「勉強可用」前進演化到「可堪大用」，使用者的期待也隨之升維，從「能否做到」躍遷至「做得多好」。

好在 Sora 並未在掌聲中原地踏步，透過與藝術家的深度合作，他們在工作流程領域做出了顯著的改進。Re-cut、Remix、Storyboard 等功能都相當實用。

甲乙方的存在決定了工作流中的溝通永遠是剛需，AI 能做的是讓這種溝通更有效率，Sora 的價值不在於它能做什麽，而在於讓創作者得以抽身於技術細節，真正回歸創意的本質。

與此同時，上周引發熱議的 200 美元 ChatGPT Pro 訂閱計劃，如今也有了更合理的價格錨點，該計劃同樣支持無限制存取 Sora，這種產品協同效應預計也將激發出遠超預期的套用場景和商業價值。

放眼當下，使用者的真金白銀從不作假。

可靈 AI 交出千萬級月流水的亮眼成績單，這片藍海的潛力已呼之欲出，對於仍在「燒錢」階段的 OpenAI 來說，Sora 預計會成為繼 ChatGPT 之後的另一個下金蛋的母雞。

當 Sora 從「能用」「好用」，再到「妙用」，或許未來某一天，我們會發現，真正不存在的，不是現實，而是人類創造力的盡頭。

#歡迎關註愛範兒官方微信公眾號：愛範兒（微訊號：ifanr），更多精彩內容第一時間為您奉上。

愛範兒 | 原文連結 · 檢視評論 · 新浪微博