AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.1 生成模型

一个好的生成模型应该能实现以下两个目标。

● 基本功能:能够还原参与训练的样本,实现模仿功能。

● 创新功能:如果输入为图像,通过生成模型,能够生成原数据没有但与输入图像相似的图像;如果输入为语句,通过生成模型,能够生成输入语句的摘要或对答短语等信息。

图1-3为生成模型的架构图。

生成模型的数学表示如下:

输入:观察数据x

输出:生成模型估计的观察数据的分布函数px)。px)通常认为是高斯混合模型,高斯混合分布具有一个重要特性,即它可以拟合任何分布。如果观察数据中含标签y,则生成模型的输出就是px|y)。

图1-3 生成模型的架构图