mora:借助多智能体系统实现通用视频生成-凯发体育app

微软的一个视频生成项目 mora,利用 agents 来复原 sora 的能力,基本还原了 sora 所有的能力,目前支持生成 1024*576 分辨率的 12 秒视频。

还原的能力包括:

1)将文本转换为视频
2)根据文本条件将图片转换为视频
3)扩展已生成的视频
4)进行视频到视频的编辑
5)串联视频以及
6)模拟数字世界

项目简介:

本论文提出了一种新型的多ai框架——mora。mora融合了多个尖端视觉ai智能体,致力于复刻sora所展示的通用视频生成能力。

具体来说,mora能够运用多个视觉智能体,在多种任务中成功模仿sora的视频生成能力。

我们的广泛实验结果显示,mora在这些任务上的表现已经接近sora。然而,如果从整体上评估,我们的模型与sora之间还是存在一定的性能差距。

总的来说,我们希望这个项目能够引领未来视频生成技术的发展方向,通过多ai智能体的协同工作来实现。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun291858.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2024年3月26日
下一篇 2024年3月26日

相关推荐

网站地图