流程架构
March 20, 2025 · View on GitHub
长期记忆针对传统 AI 对话“瞬时记忆”的局限性,通过抽取用户偏好、行为习惯等信息,实现在跨周期对话中保持认知连贯性,激发大模型提供更具个性化的互动能力,解决当前大模型在陪伴社交、AI 教育、车机助手、智能硬件等场景下记忆缺失、对话断层、沟通失真的问题。长期记忆方案,基于 DeepSeek-R1 模型的强大思考能力将对话内容抽取成记忆,并在对话到相关话题时帮助 Doubao 角色模型生成更贴合角色人设的回复。当前应用基于开源 mem0 项目结合火山大模型服务搭建。
场景示例:
- 结合偏好个性推荐:在推荐场景,会结合用户在饮食、兴趣、习惯上的偏好提出个性化建议
- 记忆用户关键日程:用户曾提及每周五会上瑜伽课,那么后续每逢周五,系统都会在对话中主动进行日程提醒
- 持续追踪学习轨迹:在教育辅导场景,如果学生在同一知识点反复出错,系统会有针对性进行强化训练
流程架构
关联模型及云产品
模型
| 相关服务 | 描述 | 计费说明 |
|---|---|---|
| DeepSeek-R1 | DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力 | 计费说明 |
| Doubao-pro-32k | 是豆包推出行业领先的专业版大模型。模型在参考问答、摘要总结、创作等广泛的应用场景上能提供优质的回答,是同时具备高质量与低成本的极具性价比模型 | 计费说明 |
| Doubao-embedding | 由字节跳动研发的语义向量化模型,主要面向向量检索的使用场景,支持中、英双语,最长 4K 上下文长度。向量维度 2048 维,支持 512、1024 降维使用。 | 计费说明 |
云产品
| 相关服务 | 描述 | 计费说明 |
|---|---|---|
| 向量数据库VikingDB | 基于火山引擎的云基础设施搭建,用于生产、存储、索引和分析来自机器学习模型产生的海量向量数据的数据库系统 | 计费说明 |
| 函数服务 | 事件驱动的无服务器函数托管计算平台 | 计费说明 |
| API网关 | 基于云原生、高扩展、高可用的云上网关托管服务 | 计费说明 |
| 日志服务 | 提供针对日志类数据的一站式服务 | 计费说明 |
部署说明
环境准备
- 要求 3.9 ≤ Python 版本 < 3.12
- Node 18.0 或以上版本
- PNPM 8.10 或以上版本
- 已创建 Doubao-pro-32K-character-241215 的endpoint 参考文档
- 已创建 DeepSeek-R1 的endpoint 参考文档
- 已创建 Doubao-embedding 的endpoint 参考文档
- 开通 VikingDB 向量库(华北)参考文档
- 创建AK、SK,创建子账号及策略配置 参考文档
快速入门
- 下载代码库
git clone https://github.com/volcengine/ai-app-lab.git
cd demohouse/longterm_memory
- 修改配置
- 修改
backend/code/config.py中配置,填入刚刚获取的 endpoint id 、AK、SK
- 安装后端依赖
cd backend
注意:下面命令需要在
backend目录下执行
python -m venv .venv
source .venv/bin/activate
pip install poetry==1.6.1
poetry install
- 启动后端
bash run.sh
- 启动前端
cd ../frontend
pnpm install
pnpm run dev
技术实现
- 核心架构与能力整合
- 本项目通过 DeepSeek-R1 大模型的深度推理能力(透明化思维链与多步逻辑验证)、豆包 character 模型的对话交互优势,以及 VikingDB 向量库的高效检索能力,构建了一套大模型长期记忆解决方案
- 技术实现路径
- 事实提取:利用 DeepSeek-R1 的深度思考能力,从历史对话中精准提取关键事实,确保信息结构化存储
- 向量存储:将提取的事实通过 VikingDB 进行向量化编码,支持跨会话、超长上下文的高效关联检索
- 记忆增强:当对话超出模型窗口限制或开启新会话时,系统通过向量相似度匹配,召回最相关历史事实,辅助豆包模型生成连贯且个性化的回复
- 核心创新优势
- 推理透明性:DeepSeek-R1 的显性化思维链,使事实提取过程可追溯,降低 “AI 幻觉” 风险
- 低成本高效性:基于 DeepSeek-R1 开源架构的推理成本较低 ,结合 VikingDB 的优化检索算法,实现高性价比的长期记忆管理
- 场景适配性:豆包 character 模型对话能力,配合记忆增强机制,可灵活应用于教育、客服、医疗等复杂场景
目录结构
├── README.md
├── asset
├── frontend
└── backend
├── code
│ ├── __init__.py
│ ├── prompt.py # 相关prompt
│ ├── config.py # 配置文件
│ └── main.py # 入口函数
├── mem0ai-0.1.48.1-py3-none-any.whl # 开源代码mem0代码包
├── poetry.lock
├── pyproject.toml
└── run.sh # 启动脚本
火山记忆库介绍
当前广场上架的记忆应用依托的是开源 mem0 框架,可以快速体验了解长期记忆的工作原理和效果。 此外,火山也提供自研长期记忆云服务解决方案-火山记忆库,架构图如下:

相比于 mem0 工具,火山记忆库是一套完整的云服务解决方案,支持 restful API 集成使用,支持业务规模更大、稳定性更强、记忆交互效果更好
- 在范式上,相比于 mem0 增加对“用户画像”记忆的抽取,加深用户理解
- 在能力上,支持记忆场景下的意图识别、问题改写、记忆冲突处理、记忆清理等模块
- 在场景上,覆盖单聊、群聊等众多业务场景需求
联系我们
火山记忆库产品试用,请填写:试用申请
应用开发,点击加入飞书群: 应用实验室开发者沟通群
