三层记忆系统:让 AI Agent 不再「失忆」
AI Agent 最大的问题不是推理能力——是记忆。每次对话从零开始,忘了你昨天说过什么、有什么偏好、项目进度如何。传统做法是给 System Prompt 里塞上下文,但这像每次开会前重新读一遍会议纪要——低效,且不可持续。
我们设计了一套三层记忆架构,本质上就是把「人的记忆方式」翻译成计算机能跑的系统。
L1:结构化记忆
第一层是「主动记忆」——你说过的重要的事,被结构化整理下来。具体由三个文件组成:
MEMORY.md—— 长时记忆,类似人类大脑中筛选过的核心认知:你是谁、能做什么、有什么项目、做过什么决策memory/YYYY-MM-DD.md—— 每日日志,一次对话一个文件,记录发生了什么- TDAI 场景块 —— 按主题分片的长时上下文,比如「京东联盟变现系统」「社交平台桥接服务」
Agent 每次启动时先读 MEMORY.md,相当于「想起自己是谁」。对话中需要具体信息时,从场景块和日志中检索。
L2:自动化维护
记忆系统如果靠人维护,很快就会过时。第二层是一套定时任务,让系统自检自修:
- 心跳巡检(~08:00 / ~20:00):检查 MEMORY.md 是否过期、每日日志是否缺失、场景块数量是否完整、Cron 是否有报错
- 记忆梦境晋升(每天 03:00):将短期高频回忆自动提升到长期记忆文件
- 记忆整合(每 3 天):从每日日志提炼关键事件到 MEMORY.md 和场景块,清理冗余
这三条 Cron 串起来,让系统像人睡觉时「巩固记忆」一样,自动把碎片信息聚合成结构化知识。
L3:向量检索 + 知识蒸馏
前两层管人的记忆,第三层管「外部知识摄入」。具体流程:
- 每 6 小时抓取 12 个 RSS 源(科技、AI、半导体、科学、经济)
- LanceDB 向量入库,支持语义检索
- AI 蒸馏管线从 3,450 篇文章中提取核心观点,生成简短中文摘要
当你问「最近 AI 领域有什么新进展」,Agent 不是去搜——是从自己的知识库检索。这跟人的阅读习惯类似:不是你每次提问都重读一遍论文,而是平时积累,用时调取。
技术选型
选了 LanceDB 而不是 Pinecone/Weaviate——本地运行、零额外服务、Rust 核心、Python/Node.js 双 API。在一台 1.9GB 的服务器上同时跑 Gateway + LanceDB + Nginx + Chrome,内存够用。
为什么自建
市面上的记忆方案(MemGPT、Letta、各种 LangChain 的 Memory 模块)大多封装在黑盒里,改不了检索策略,迁不了存储后端。自建的好处是每层都可控:换数据库、改蒸馏 prompt、调检索参数,都在自己手里。
更重要的是——建完之后,你真正理解了 Agent 记忆系统是怎么回事。
📱 关注公众号「星尘和光文化传媒」
每周推送 AI 实战技术文章、全栈开发案例和自动化管线拆解。
不写广告,只写踩坑录。