大模型应用开发:动手做AI Agent
上QQ阅读APP看书,第一时间看更新

1.4.3 结合语言交互能力和多模态能力

当组合语言交互能力和多模态能力时,Agent的感知力和适应力将得到极大增强。例如,一个可以理解口头指令并通过视觉识别表情的智能家居助理能更精确地理解用户的需求。在教育应用中,一个结合语言理解和视觉识别的Agent能够提供个性化的互动学习体验。