拥抱AIGC
上QQ阅读APP看书,第一时间看更新

1.1.5 视频生成

生成式人工智能几乎同时应用于视频生成和图像生成领域,其发展时间线相差无几。事实上,视频生成领域的关键进展之一是GAN的发展。得益于GAN在生成逼真图像方面的高准确性,研究人员开始将其应用于视频生成。最著名的示例之一便是DeepMind的Motion to Video,它仅凭一张图像和一系列动作就能生成高质量的视频。另一个典型示例是NVIDIA的Video-to-Video SynthesisVid2Vid),它基于深度学习框架,使用GAN技术根据输入视频生成高质量的视频。

Vid2Vid可以生成时间上连贯的视频,这意味着视频能够随时间推移保持播放流畅且逼真。该系统可用于执行各种视频生成任务,如下所示。

变换视频风格,例如,将日间效果视频转换为夜间效果视频或将草图转换为逼真的图像。

修改现有视频,例如,更改视频中对象的样式或外观。

根据静态图像生成新视频,例如,将一系列静止图像动画化。

2022年9月,Meta的研究人员宣布推出Make-A-Video,这是一种新的人工智能系统,可以帮助用户将自然语言提示转换为视频剪辑。这一技术背后包含我们刚提到的许多其他领域的模型——用于提示的语言理解模型、用于图像生成的图像和运动生成模型,以及由人工智能作曲助手制作的背景音乐。

综上所述,多年来,生成式人工智能已经给众多领域带来了“冲击”,出现了许多足以给艺术家、企业甚至普通用户的工作提供支持的人工智能工具。相信随着技术的发展,生成式人工智能会有更广阔的应用空间!接下来,在了解OpenAI模型的相关内容之前,我们先介绍生成式人工智能的研究历程和新进展。