更新时间:2024-09-05 17:12:34
封面
版权信息
版权
内容提要
前言
一个新纪元的黎明
题记
资源与支持
资源获取
第1章 何谓Agent,为何Agent
1.1 大开脑洞的演讲:Life 3.0
1.2 那么,究竟何谓Agent
1.3 Agent的大脑:大模型的通用推理能力
1.3.1 人类的大脑了不起
1.3.2 大模型出现之前的Agent
1.3.3 大模型就是Agent的大脑
1.3.4 期望顶峰和失望低谷
1.3.5 知识、记忆、理解、表达、推理、反思、泛化和自我提升
1.3.6 基于大模型的推理能力构筑AI应用
1.4 Agent的感知力:语言交互能力和多模态能力
1.4.1 语言交互能力
1.4.2 多模态能力
1.4.3 结合语言交互能力和多模态能力
1.5 Agent的行动力:语言输出能力和工具使用能力
1.5.1 语言输出能力
1.5.2 工具使用能力
1.5.3 具身智能的实现
1.6 Agent对各行业的效能提升
1.6.1 自动办公好助手
1.6.2 客户服务革命
1.6.3 个性化推荐
1.6.4 流程的自动化与资源的优化
1.6.5 医疗保健的变革
1.7 Agent带来新的商业模式和变革
1.7.1 Gartner的8项重要预测
1.7.2 Agent即服务
1.7.3 多Agent协作
1.7.4 自我演进的AI
1.7.5 具身智能的发展
1.8 小结
第2章 基于大模型的Agent技术框架
2.1 Agent的四大要素
2.2 Agent的规划和决策能力
2.3 Agent的各种记忆机制
2.4 Agent的核心技能:调用工具
2.5 Agent的推理引擎:ReAct框架
2.5.1 何谓ReAct
2.5.2 用ReAct框架实现简单Agent
2.5.3 基于ReAct框架的提示
2.5.4 创建大模型实例
2.5.5 定义搜索工具
2.5.6 构建ReAct Agent
2.5.7 执行ReAct Agent
2.6 其他Agent认知框架
2.6.1 函数调用
2.6.2 计划与执行
2.6.3 自问自答
2.6.4 批判修正
2.6.5 思维链
2.6.6 思维树
2.7 小结
第3章 OpenAI API、LangChain和LlamaIndex
3.1 何谓OpenAI API
3.1.1 说说OpenAI这家公司
3.1.2 OpenAI API和Agent开发
3.1.3 OpenAI API的聊天程序示例
3.1.4 OpenAI API的图片生成示例
3.1.5 OpenAI API实践
3.2 何谓LangChain
3.2.1 说说LangChain
3.2.2 LangChain中的六大模块
3.2.3 LangChain和Agent开发
3.2.4 LangSmith的使用方法
3.3 何谓LlamaIndex
3.3.1 说说LlamaIndex
3.3.2 LlamaIndex和基于RAG的AI开发
3.3.3 简单的LlamaIndex开发示例
3.4 小结
第4章 Agent 1:自动化办公的实现——通过 Assistants API和DALL·E 3模型创作PPT
4.1 OpenAI公司的Assistants是什么
4.2 不写代码,在Playground中玩Assistants
4.3 Assistants API的简单示例
4.3.1 创建助手
4.3.2 创建线程
4.3.3 添加消息
4.3.4 运行助手
4.3.5 显示响应
4.4 创建一个简短的虚构PPT
4.4.1 数据的收集与整理
4.4.2 创建OpenAI助手
4.4.3 自主创建数据分析图表
4.4.4 自主创建数据洞察
4.4.5 自主创建页面标题
4.4.6 用DALL·E 3模型为PPT首页配图
4.4.7 自主创建PPT
4.5 小结
第5章 Agent 2:多功能选择的引擎——通过 Function Calling调用函数
5.1 OpenAI中的Functions
5.1.1 什么是Functions
5.1.2 Function的说明文字很重要