站点图标 Linux-技术共享

Sora内测使用方法

 

 

Sora将超越目前市场上的所有文字生成视频模型。从此刻开始,我们所见到的视频和动图将全部由这个AI生成,而非实际拍摄。

技术方面,目前OpenAI透露的不多,简单介绍如下:
Sora是一种扩散模型,从噪声开始,能够一次生成整个视频或扩展视频的长度,
关键之处在于一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变。
与GPT模型类似,Sora使用了Transformer架构,有很强的扩展性。下面我们一起看看Sora生成的一分钟视频,看看它到底牛在哪里!

 

AI想象中的龙年春节,红旗招展人山人海。
图中人物的瞳孔、睫毛、皮肤纹理,都逼真到看不出一丝破绽,完全没有AI味儿

 

 

一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。

竖屏超近景视角下,这只蜥蜴细节拉满:

 

在一间拥有电影级灯光设置的充满托斯卡纳乡村风情的厨房里,一位擅长利用社交媒体的奶奶,正在教你制作美味的自制诺奇面。

 

五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

退出移动版