AI智能体技术架构
背景
最近和小伙伴参加了「百度搜索·文心智能体创新大赛」,做了一个AI旅行助手,正好赶上国庆假期了,计划旅游或正在的朋友可以用起来。 本文,正是基于AI智能体【旅游好助手】的创造过程,行文说一下用到的相关架构设计以及工作流开发等。
关于【旅游好助手】
点我体验: 体验链接 - 旅游好助手
它能干啥呢?看这里👇
- 🗓 智能行程规划:基于需求定制旅游攻略
- 🌤天气预测与着装建议:确保舒适出行
- 📋 打包清单:不遗漏必需品
- 💰 费用预算:合理控制旅程开支
- 🏞 旅游地点推荐:发掘国内精彩景点
- 🎙 旅行讲解:了解目的地文化历史
整体架构
-
单agent模式
- 单智能体(Single Agent):当只有一个智能体在环境中独立操作时,这就是单智能体系统。
- 多智能体(Multi Agent):当多个智能体共存一个环境中,需要相互作用时,就形成了多智能体系统。
-
整体架构图
-
工作流示意图
智能体设置
针对智能体设置名称和简介
人设与回复逻辑
- 思考路径
- 关于插件和工作流的调用,注意采用{场景}{工作流/插件}方式进行设定,例如:
- 当用户询问吃喝相关信息时,使用 {restaurant_info_query}插件。
- 当用户询问天气时,调用工作流{travel_weather}。
- 关于插件和工作流的调用,注意采用{场景}{工作流/插件}方式进行设定,例如:
对话
开场白 & 开场白问题
- 开场白即对智能体的介绍
- 开场白问题是用于引导用户如何和智能体对话
自动追问
- 在智能体回复后,自动根据对话内容提供给用户相关问题建议
- 用于引导用户流程化使用智能体的关键要素
能力
联网搜索
- 智能体将在需要时自动搜索最新的全网信息,给到用户更实时、丰富的回答
- 即利用搜索引擎搜集一些信息并呈现
知识库
- 对于专业领域的定制智能体特别需要
- 扩展智能体的知识储备,为用户提供更针对性的答案;智能体公开发布后可生成优质问答,用于调优
插件
- 通过AI推荐或自主添加插件实现智能体调用外部信息,扩展更多能力
- 插件一般分为两种,一是官方自带的,二是自己开发的
- 开发插件,这里以百度文心一言为例
工作流
- 工作流常见的节点
- 大模型:一般用于总结,提取关键意图,优化输出等
- 知识库:同能力中的知识库,这里的知识库可用于工作流
- HTTP:接口请求,一般自己开发特定功能的接口,智能体的接口对接可以通过工作流中的HTTP节点
- 插件:能力中的插件和工作流中的插件有所不同,一般工作中的插件是能力中的插件的子集
- 选择器:可以理解为js中的
switch case
表达式 - 文本处理:
- 代码:支持js和python语法,用于功能比较单一的编程
- 变量:贯穿工作流的连接各节点的要素正是变量
- 消息:工作流工作过程中一些结果或数据的输出可以通过消息直接返回
记忆
- 数据库: 以数据表形式组织数据,可以实现类似记账、读书笔记等功能
- 长期记忆:总结聊天对话的内容,并用于更好的回答用户的问题
角色
- 声音:支持选择及克隆声音,用于输出内容播报以及智能体与用户对话的声音
- 背景:增加背景图片,为用户提供沉浸式的对话和打电话体验,例如旅游好助手的背景图:
商业转化
- 链接挂载:挂载推荐链接,赚取推荐费
- 线索转化:该能力仅支持企业账号使用,请提交企业资质或更换具备企业资质的账户后使用。
- 商品挂载:挂载商品链接,实现商业转化
总结与展望
- 【旅游好助手】AI智能体基于百度文心一言智能体搭建平台,采用单agent模式,依靠智能体记忆能力,融合了知识库多插件双工作流输出,搭建了旅游专业领域智能体,实现一站式旅游AI对话。
- 在搭建过程中,涉及到提示词的优化,思考路径的解析,工作流程设计,商业召回等等。
- 体验链接 - 旅游好助手