流程架构

March 20, 2025 · View on GitHub

长期记忆针对传统 AI 对话“瞬时记忆”的局限性，通过抽取用户偏好、行为习惯等信息，实现在跨周期对话中保持认知连贯性，激发大模型提供更具个性化的互动能力，解决当前大模型在陪伴社交、AI 教育、车机助手、智能硬件等场景下记忆缺失、对话断层、沟通失真的问题。长期记忆方案，基于 DeepSeek-R1 模型的强大思考能力将对话内容抽取成记忆，并在对话到相关话题时帮助 Doubao 角色模型生成更贴合角色人设的回复。当前应用基于开源 mem0 项目结合火山大模型服务搭建。

场景示例：

结合偏好个性推荐：在推荐场景，会结合用户在饮食、兴趣、习惯上的偏好提出个性化建议
记忆用户关键日程：用户曾提及每周五会上瑜伽课，那么后续每逢周五，系统都会在对话中主动进行日程提醒
持续追踪学习轨迹：在教育辅导场景，如果学生在同一知识点反复出错，系统会有针对性进行强化训练

流程架构

关联模型及云产品

模型

相关服务	描述	计费说明
DeepSeek-R1	DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力	计费说明
Doubao-pro-32k	是豆包推出行业领先的专业版大模型。模型在参考问答、摘要总结、创作等广泛的应用场景上能提供优质的回答，是同时具备高质量与低成本的极具性价比模型	计费说明
Doubao-embedding	由字节跳动研发的语义向量化模型，主要面向向量检索的使用场景，支持中、英双语，最长 4K 上下文长度。向量维度 2048 维，支持 512、1024 降维使用。	计费说明

云产品

相关服务	描述	计费说明
向量数据库VikingDB	基于火山引擎的云基础设施搭建，用于生产、存储、索引和分析来自机器学习模型产生的海量向量数据的数据库系统	计费说明
函数服务	事件驱动的无服务器函数托管计算平台	计费说明
API网关	基于云原生、高扩展、高可用的云上网关托管服务	计费说明
日志服务	提供针对日志类数据的一站式服务	计费说明

部署说明

环境准备

要求 3.9 ≤ Python 版本＜ 3.12
Node 18.0 或以上版本
PNPM 8.10 或以上版本
已创建 Doubao-pro-32K-character-241215 的endpoint 参考文档
已创建 DeepSeek-R1 的endpoint 参考文档
已创建 Doubao-embedding 的endpoint 参考文档
开通 VikingDB 向量库（华北）参考文档
创建AK、SK，创建子账号及策略配置参考文档

快速入门

下载代码库

 git clone https://github.com/volcengine/ai-app-lab.git
 cd demohouse/longterm_memory

修改配置

修改backend/code/config.py 中配置，填入刚刚获取的 endpoint id 、AK、SK

安装后端依赖

cd backend

注意：下面命令需要在backend目录下执行

python -m venv .venv
source .venv/bin/activate
pip install poetry==1.6.1

poetry install

启动后端

bash run.sh

启动前端

cd ../frontend
pnpm install
pnpm run dev

技术实现

核心架构与能力整合

本项目通过 DeepSeek-R1 大模型的深度推理能力（透明化思维链与多步逻辑验证）、豆包 character 模型的对话交互优势，以及 VikingDB 向量库的高效检索能力，构建了一套大模型长期记忆解决方案

技术实现路径

事实提取：利用 DeepSeek-R1 的深度思考能力，从历史对话中精准提取关键事实，确保信息结构化存储
向量存储：将提取的事实通过 VikingDB 进行向量化编码，支持跨会话、超长上下文的高效关联检索
记忆增强：当对话超出模型窗口限制或开启新会话时，系统通过向量相似度匹配，召回最相关历史事实，辅助豆包模型生成连贯且个性化的回复

核心创新优势

推理透明性：DeepSeek-R1 的显性化思维链，使事实提取过程可追溯，降低 “AI 幻觉” 风险
低成本高效性：基于 DeepSeek-R1 开源架构的推理成本较低，结合 VikingDB 的优化检索算法，实现高性价比的长期记忆管理
场景适配性：豆包 character 模型对话能力，配合记忆增强机制，可灵活应用于教育、客服、医疗等复杂场景

目录结构

├── README.md
├── asset
├── frontend 
└── backend
    ├── code
    │   ├── __init__.py
    │   ├── prompt.py    # 相关prompt
    │   ├── config.py    # 配置文件
    │   └── main.py        # 入口函数
    ├── mem0ai-0.1.48.1-py3-none-any.whl # 开源代码mem0代码包
    ├── poetry.lock
    ├── pyproject.toml
    └── run.sh             # 启动脚本

火山记忆库介绍

当前广场上架的记忆应用依托的是开源 mem0 框架，可以快速体验了解长期记忆的工作原理和效果。此外，火山也提供自研长期记忆云服务解决方案-火山记忆库，架构图如下：

相比于 mem0 工具，火山记忆库是一套完整的云服务解决方案，支持 restful API 集成使用，支持业务规模更大、稳定性更强、记忆交互效果更好

在范式上，相比于 mem0 增加对“用户画像”记忆的抽取，加深用户理解
在能力上，支持记忆场景下的意图识别、问题改写、记忆冲突处理、记忆清理等模块
在场景上，覆盖单聊、群聊等众多业务场景需求

联系我们

火山记忆库产品试用，请填写：试用申请

应用开发，点击加入飞书群：应用实验室开发者沟通群