2.3 预训练模型的结构和变种