汽车
morning
腾讯混元发布 Hy-Memory:打造记忆力超强的 Agent 第二大脑
2026-05-28
1 阅读
IT之家
IT之家 5 月 28 日消息,腾讯混元宣布正式推出 Hy-Memory。据介绍,这是一个专门为 Openclaw 这类长期协作型 Agent 设计的记忆插件,能真正成为 Agent 的“第二大脑”。 官方称,Hy-Memory 用 6 层记忆框架 × System1/System2 双系统 × 演化链三层底牌,让 Agent 在长期使用中真正 " 记得住、记得对、记得轻、更懂你 "。 在权威公开测试集上,Hy-Memory 效果超过现有主流 memory 框架,可以解决记忆碎片化问题,记忆数量低 70%+,每条记忆信息密度高 45%+。在处理超长上下文方面,Hy-Memory 消耗的 token 量降低 35%,记忆更新速度快 20%。 IT之家附官方详细介绍如下: Agent 任务对长期记忆的要求远超 Chat 使用 Agent 和 Openclaw 深度用户,常常描述过一种常见的“三周轨迹”。 第一周: 蜜月期,把自己当下正在忙的事情,比如一个项目的来龙去脉、最近的决定和取舍、未来想做的方向一股脑都告诉 Openclaw。,能回答问题、能查资料、能帮你规划、能写代码、能起草文档。“这玩意儿真好用”—— 这是大多数人第一周的真实感受。 第二周: 开始不安。人们注意到每天打开 Openclaw 都得先花 3 到 5 分钟提醒它我们在做什么。它好像不太记得几天前讨论过的判断。当你对它说“按之前那个方案”,它会反问“哪个方案”,说“那个我们排除掉的选项”,它却想不起来排除的是什么、为什么排除。不是完全不记得。Openclaw 默认的记忆机制能记住一些最近的对话原文,但跨天、跨 Session、那些更深的判断,它就漂移了。 第三周: 主动降级使用,开始下意识地缩短跟它讨论的深度。不再问“这个方向我该不该走”,因为知道明天它就忘了。变成只问最具体、最即时的小问题: 搜个资料、查个语法、改一段文字。 最常见的结局是,Openclaw 在使用者眼里,慢慢从“能陪你思考的伙伴”,降级成了“一个查询工具”。这不是 Openclaw 的问题 —— 它的内核能力一直很强。问题在于:长期协作类任务对长期记忆的要求,远超过普通 Chat。 Hy-Memory 这个 Openclaw 记忆插件的初衷,就是为了把这三周轨迹的后两周抹掉 —— 让用户第一周怎么用 Openclaw,第三个月还能怎么用,而且越用越懂。 1、长期任务对记忆的挑战比想象中难 长期任务跟普通 Chat 完全是两种工作。不管你拿 Openclaw 调研一个复杂决策、写一本书、规划一次大旅行、跟进一个跨季度的项目,一次对话可能 30 轮 50 轮 100 轮,中间不停地查资料、调工具、读文档、出方案、回退、再改、再走,一个 Session 可能持续几个小时,任务可能跨越数周。 记忆系统至少要扛住 4 件事: 任何一个环节崩了,体验就崩了。 2、一个合格的 Openclaw 记忆插件要满足的 3 条标准 我们在设计 Hy-Memory 的时候围绕“什么样的记忆插件才配得上 Openclaw 这种长期协作场景”,定了 3 条硬标准。 标准一:不能丢历史。 用户跟 Agent 聊过的所有“为什么选这个、为什么否那个”—— 这些判断和因果不能丢。否则下次它推荐方案,可能直接推荐回用户已经否过的那个,白费时间。 标准二:要能演化。 人不是一个静态的存在。技术偏好、生活习惯、长期目标都会随时间变,对某件事的看法也会反复调整,这些都得被记住。不是覆盖式的“只记最新”, 也不是堆积式的“全都留下”,而是要有一个清晰的演化轨迹。 标准三:要在主链路里不仅足够快,还要有认知迭代,进化。 记忆插件不能拖慢用户当下打字、调用工具、等结果的速度。每次搜索要在毫秒级, 召回也不能成为响应瓶颈。同时还要有深层次的语义和事实理解。 接下来,我们把 Hy-Memory 满足这 3 条标准的三层底牌分别讲清楚。 Hy-Memory 的三层核心 第一层:6 层记忆框架 —— 给每种记忆找到正确位置 Hy-Memory 做的第一件事, 是没有把所有记忆塞进同一张表。 想一下 —— 用户跟 Openclaw 聊到最近在准备出国留学, 这段话里其实混着好几种东西: · “我在准备出国留学”—— 这是事实 · “我偏好北欧那种慢节奏的项目”—— 这是画像 · “我做大决策前会先列利弊清单”—— 这是心智模型 · “我下周大概率会问推荐信怎么找教授”—— 这是前瞻意图 这些东西信息形态完全不一样, 但传统记忆系统会把它们全揉成一堆向量,搜索时一锅捞。Hy-Memory 把记忆分成 6 层,每层一种职责。下面用一组多领域混合的例子,让你感受 Agent “记的是什么”: 用户问 Openclaw “我做大决策有什么习惯”, 它应该优先看 L5 心智模型, 而不是把过去 100 轮对话原文一锅塞过来。用户问 " 我现在住在哪 ",L2 一条事实就够了。问什么、走哪层、用什么样的检索权重 —— 分层让这些都变得可能。 整个 prompt 会变干净。模型的注意力不再被无关原文稀释。 第二层:双系统设计,既保障速度又具备认知迭代 Hy-Memory 把来自人脑认知科学的 System1 / System2 机制直接复刻到了 Agent 的记忆加工上 —— 就像给 Openclaw 装了一颗符合认知科学的 " 大脑 "。 Hy-Memory 把记忆加工拆成两套。 System1 (白班):用户回车那一秒,实时地处理写入的记忆。负责写原始痕迹、抽事实、更新画像、压会话摘要 —— 也就是 L1–L4 System2 (夜班):秒到分钟级,在后台跑。负责抽心智模型、构建知识网络、预测意图 —— 也就是 L5–L6 为什么要拆?因为深度认知很慢。抽你的“决策心智模型”、构建你的“知识网络”—— 做完一遍 LLM 可能要 5 到 20 秒。如果让你每次调用 Openclaw 都等 20 秒才能收到回复,谁都用不下去。 但你要的也不仅是“快”—— 你要的是 Agent 越用越懂你。Hy-Memory 的拆分把这两件互相打架的事变成两条独立通道: 1、发送消息后 System1 已经把“立即可用的记忆”写好了 —— 下一句对话能立刻用上 2、 System2 在后台慢慢做更深的认知 —— 把你两周的对话沉淀成“你的决策心智” 结果在对话最直接的影响:你每次说完的信息它能立马记住;而它对你的理解还在后台不断变深。 第三层:演化链 —— 记忆能改写但不丢因果 第三层是 Hy-Memory 真正的杀手锏,也是我们觉得用户长期跟 Agent 协作时最容易踩坑、也最值得做对的一件事。 一个典型的长期场景:假设一位用户跟 Openclaw 聊了大半年自己的健身计划。过去半年里他的训练方式发生过 4 次明显的态度转折: · 去年春 — 开始跑步训练有氧,效果不错,体重和精神状态都改善了,对跑步充满信心 · 去年夏 — 跟练 HIIT,强度太大,膝盖出了问题,被迫停训两周 · 去年秋 — 转向纯力量训练,只练大重量、放弃了心肺,结果跑两公里都喘, 挫败 · 上月 — 形成「力量 + 慢跑 + 瑜伽」混合方案,身体状态终于稳定下来 今