開放人工智能研究中心OpenAI今日(16日)於社交平台X發文,介紹一款名為「Sora」的影片生成模型,能根據使用者給予的文字提示生成短影片,內容包含多個角色及特定類型的動態畫面,影片長度最多60秒,也可依據靜態圖像製作動畫。
OpenAI發文介紹一款名為「Sora」的影片生成模型。(OpenAI 社交平台X圖片)
OpenAI表示,該模型有部分缺失無法克服,初期僅提供給「紅隊成員」進行風險測試,及由部分視覺藝術、視覺設計或是影片工作者進測試與反饋,未開放大眾使用,但未來對內容創作者可能帶來的巨大挑戰,仍引起高度重視。
OpenAI在網站展示以「Sora」生成的影片,包括:加州淘金熱期間的空中場景、及看似從東京列車內部拍攝的影片等。OpenAI指出,「Sora」有能力理解物體在物理世界中的存在方式,準確解讀道具,進而創建能夠表達豐富情感的多個角色、及特定類型的動作,也能基於靜態圖片生成影片,或填補現有影片的遺失幀,將其延長。
OpenAI表示,Sora目前為未完成的產品,可能難以消化複雜的物理或空間細節,導致生成不合邏輯的影片,例如:人在跑步機上可能跑錯方向,或博物館影片中地板會「移動」及影片中被咬的餅乾不會出現被咬過後的缺口等,目前僅對正在評估潛在危害和風險的「紅隊成員」開放,以幫助識別系統中的缺陷,藉此獲得使用回饋。依照Open AI技術推進及AI成長速度,一般預料,明年文字生成影片這項功能,就會有機會進入一般消費者可以使用存取的應用階段。
Sora發布後,OpenAI CEO Sam Altman都沉迷到不能自拔,他不僅瘋狂發推安利,而且還親自下場為網友生成視頻「你們隨意來prompt,我一一輸出。」
一位戴着尖頂帽,身披綉有白色星星的藍色長袍的巫師正在施法,他的一隻手射出閃電,另一隻手中拿着一本舊書。(Sam Altman 社交平台X圖片)
在一間擁有電影級燈光設置的充滿托斯卡納鄉村風情的廚房裏,一位擅長利用社交媒體的奶奶,正在教你製作美味的自製諾奇面。(Sam Altman 社交平台X圖片)
Sam Altman對此功能沉迷到不能自拔,不僅瘋狂發推安利,而且還親自下場為網友生成視頻。(Sam Altman 社交平台X圖片)
(視頻來源:OpenAI網站)
【點新聞報道】開放人工智能研究中心OpenAI今日(16日)於社交平台X發文,介紹一款名為「Sora」的影片生成模型,能根據使用者給予的文字提示生成短影片,內容包含多個角色及特定類型的動態畫面,影片長度最多60秒,也可依據靜態圖像製作動畫。
一位X用戶分享了Sora生成的一名女子在東京街頭漫步的視頻,並評論稱:「OpenAI今天宣布了Sora,它使用混合擴散和變壓器模型架構生成長達1分鐘的視頻。他們似乎又領先了其他所有人1-2年。」
有一位X用戶評論稱:「gg皮克斯。」馬斯克則回應稱:「gg人類(gg humans)。」亦有用戶附和道:「gg好萊塢」「gg新媒體」「RIP迪士尼」等等。
Sora成熱門話題,馬斯克也十分關注。(x截圖)
gg是網絡遊戲用語「good games」的縮寫,主要用於遊戲結束後,輸贏雙方都可以用。但現在多由失敗方發出,表示認賭服輸、心服口服的意思。
新聞鏈接:
《(有片+多圖)OpenAI推新模型Sora 可依文字生成1分鐘影片》
https://www.dotdotnews.com/a/202402/16/AP65cf0b28e4b0737137a12c56.html
新聞来源: 點新聞
本文著作權歸點新聞平台所有,非商業轉載請註明出處來源點新聞,商業轉載請聯繫點新聞info@dotdotnews.com