腾讯和香港科技大学一起开源了一个新的视频生成模型。
其中包括视频VAE和3D去噪U-net。在2000万个视频和6亿张图像上进行训练,优于其他开源视频生成模型。
这是一个类似与 pika 和moonvalley 的技术,他们还开放了一个类似的 Discord 频道用来测试。支持图片生成视频和文字生成视频。感兴趣可以去试试。
我从他们频道里面找了几个比较好的例子放在了下面视频里面。
项目地址:https://t.co/EP9G4fnwb1
Discord:https://t.co/NYwFdrL3aC