揭秘OpenAI Sora:革命性AI影片生成 如何重塑影片創作未來

OpenAI Sora

在2月16日,OpenAI,一家領先的人工智能研究機構,宣布了他們正在開發一種名為「 Sora 」的創新AI模型。這款模型擁有根據文字提示生成短影片的能力。雖然Sora目前尚未向公眾開放,但其概念已在網絡上引起廣泛關注,甚至一度登上社交媒體平台X的熱門趨勢榜,引發人們對其可能重新定義短視頻領域的創意和市場的廣泛猜測。

目前,sora openai正處於封閉測試階段,OpenAI強調,這款模型能夠根據用戶的文字描述單獨創造出最長達一分鐘的高清影片。Sora的推出被視為該公司邁向實現通用人工智能(AGI)的一個關鍵進展。

Sora openai 是什麼?

Sora 能夠根據用戶的文字輸入創造出包含多個角色、特定動作和精細主題細節及背景的複雜場景影片。它的底層模型具有深入的語言理解能力,使其能夠準確解讀用戶的指示,創造出能夠表達豐富情感的角色,並在一個短片中建立多個場景,保持一致的角色和視覺風格。目前,OpenAI已邀請一些合作夥伴進行紅隊演練測試,並向部分視覺設計師、攝影師和製片人提供試用機會,以收集專業反饋。

OpenAI在其官方X貼文

OpenAI在其官方X帳號上發布了一條貼文,簡要介紹了Sora AI模型的功能,這款模型能夠根據用戶提供的文字提示自動創造影片,這些影片可以包含多個角色和特定的動態場景。然而,OpenAI也提醒,Sora仍處於開發階段,可能尚未能完全理解複雜的物理或空間細節,有時可能會產生不符合邏輯的影片。

官方展示的示例影片是根據「白雪、東京市、櫻花、攤販、行人」等關鍵詞生成的,這些影片的長度可達60秒,並展示了複雜的攝影機動作。除了基於文字生成影片外,Sora還能夠將靜態圖片轉化為動畫,展現出其強大的功能。

技術上,Sora是一種擴散模型,它從一個看似靜態的噪聲圖像開始,逐步去除噪聲以生成影片。Sora基於DALL-E和GPT模型的研究,利用DALL-E 3的重描述技術,為視覺訓練數據生成高度描述性的文字,從而根據用戶的文字指令生成影片。Sora不僅能從無到有創造全新的影片,還能擴展現有影片或補全遺失的畫面。

Sora 還是會出錯

OpenAI表示,Sora是基於能夠理解和模擬真實世界的模型之上的,該公司認為這是實現AGI的一個重要里程碑。然而,Sora在描繪複雜場景和理解特定因果關係方面仍需改進,例如,其生成的人物可能咬了一口餅乾,但餅乾上卻沒有留下咬痕。有時它也可能混淆提示的細節,比如弄錯左右方向,或無法準確描述隨著時間發展的事件。

在向公眾開放Sora之前,OpenAI正在加強安全測試,進行紅隊演練以評估假信息、仇恨內容和偏見對模型的影響。開發團隊也在開發檢測誤導性內容的工具,例如分類器,以在Sora生成影片時進行判斷。

隨著AI工具的迅速發展,AI產品和生成內容引起了不少爭議。針對這些爭議以及Sora正式向公眾開放可能面臨的問題和風險,OpenAI正在開發工具以檢測短影片是否由Sora生成,以幫助公眾更快分辨內容的來源。

OpenAI表示,Sora目前為未完成的產品,可能難以消化複雜的物理或空間細節,導致生成不合邏輯的影片,例如:人在跑步機上可能跑錯方向,或博物館影片中地板會「移動」及影片中被咬的餅乾不會出現被咬過後的缺口等,目前僅對正在評估潛在危害和風險的「紅隊成員」開放,以幫助識別系統中的缺陷,藉此獲得使用回饋。依照Open AI技術推進及AI成長速度,一般預料,明年文字生成影片這項功能,就會有機會進入一般消費者可以使用存取的應用階段。

Sam Altman使用 Sora 沉迷不能自拔

Sora發布後,OpenAI CEO Sam Altman都沉迷到不能自拔,他不僅瘋狂發推安利,而且還親自下場為網友生成視頻「你們隨意來prompt,我一一輸出。」

一位戴着尖頂帽,身披綉有白色星星的藍色長袍的巫師正在施法,他的一隻手射出閃電,另一隻手中拿着一本舊書。(Sam Altman 社交平台X圖片)
一位戴着尖頂帽,身披綉有白色星星的藍色長袍的巫師正在施法,他的一隻手射出閃電,另一隻手中拿着一本舊書。(Sam Altman 社交平台X圖片)
在一間擁有電影級燈光設置的充滿托斯卡納鄉村風情的廚房裏,一位擅長利用社交媒體的奶奶,正在教你製作美味的自製諾奇面。(Sam Altman 社交平台X圖片)
在一間擁有電影級燈光設置的充滿托斯卡納鄉村風情的廚房裏,一位擅長利用社交媒體的奶奶,正在教你製作美味的自製諾奇面。(Sam Altman 社交平台X圖片)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *