徐慧志的个人博客

2025-11-27 人脑的记忆和Agent的记忆是完全不同的

发布于 2025年11月27日  •  1 分钟  • 54 字
Table of contents

最近在看 Agent 记忆的一些设计,调研了4个流行的框架(MEM0、LangGraph、ZeP、ADK)之后,我发现这些框架在记忆部分其实都比较雷同——无论是短期记忆还是长期记忆,本质上都是引入一些外部知识,或者增加一个数据存储层。

短期记忆一般指当前会话中出现的消息、临时变量和当前状态,它只在当前运行的线程或 session 内有效。

长期记忆则是经过 LLM 提炼后的一些事实、事件或语义关系,是更持久的信息,对未来其他会话也可见。

在这个过程中,我比较关注的是短期记忆如何转化为长期记忆。结果发现,最后一步仍然需要依赖大模型来做转换。也就是说,只要明确定义好长期记忆和短期记忆的结构,就可以在对话中实现这种转化。

之后我又去调研了一下人脑的记忆机制,发现 Agent 的记忆和人脑记忆其实是完全不同的。Agent 的记忆只能说强行模仿人类记忆的分类方式,分为短期和长期,但只是套了个壳子,内部运行机制完全不一样。人脑处理记忆是一个极其复杂的生物学过程,记忆的载体是神经元和突触之间的连接。

如果人类是唯一有智能的生物,那么 AIGC的路还远着呢!

一、记忆的形成和存储

记忆的形成和存储大致可以分为三个阶段:

  1. 通过编码初步获取信息 编码是记忆形成的第一步,指将外界的感觉信息(视觉、听觉、触觉等)转化为大脑可以处理和存储的神经表征。这个过程是高度选择性的,并不是所有进入感官的信息都会被编码。

注意力在其中起到关键作用,它决定了哪些信息能优先进入工作记忆或短期记忆。比如在咖啡馆专注于和朋友的对话,而忽略周围的背景噪音。

  1. 通过巩固来强化记忆 巩固是指新形成的不稳定记忆痕迹逐渐转变为稳定、持久的长期记忆的过程。它分为两个层面:突触巩固和系统巩固。突触巩固发生在学习后的几分钟到几小时内,主要涉及突触连接的局部生化改变,比如长时程增强(LTP)的诱导和维持。系统巩固更缓慢,可能持续数周到数年,涉及记忆在不同脑区之间的重新组织和转移。

  2. 分布式按功能存储记忆 存储是指记忆信息在大脑中被长期保持的过程。记忆并非存储在单一位置,而是分布式地存储于由大量神经元相互连接构成的复杂神经回路中,其核心是突触结构的改变。

例如,对一个朋友的记忆,可能包括面孔(存储在颞叶的视觉皮层)、名字(存储在语言相关区域)、声音(存储在听觉皮层)以及情感(存储在杏仁核等边缘系统结构)等多个组成部分,它们通过神经连接整合在一起。

二、短期记忆和长期记忆

短期记忆

短期记忆是指信息在大脑中保持几秒到一分钟左右的记忆系统。它的容量非常有限,只能同时存储几个信息单元(如数字、字母等)。短期记忆容量小、持续时间短,容易受干扰,主要作为信息处理的临时工作台,用于暂时保持和操作信息,指导当前的决策和行为。

比如拨电话时短暂记住一串号码,打完就忘,这种就是短期记忆。

工作记忆是对短期记忆的拓展,它不仅包括信息的暂时存储,还包括对信息的加工和操作,比如心算或逻辑推理。

长期记忆

长期记忆是指信息在大脑中保持数小时、数天、数年甚至终生的记忆系统。它的容量几乎是无限的,相对稳定,不易受干扰。长期记忆的形成需要将短期记忆中不稳定的神经活动模式转化为持久的、结构性的改变,这个过程就是巩固。

长期记忆可以分为外显记忆和内隐记忆。外显记忆也叫陈述性记忆,包括对个人经历和事件的情景记忆,以及对事实、概念等知识的语义记忆。内隐记忆则包括程序性记忆(如技能和习惯)、启动效应等。这些不同类型的长期记忆依赖于不同的脑区网络。

短期记忆是如何转化为长期记忆的?

这个问题本身可能就不太准确,因为长期记忆不一定是短期记忆直接“转化”来的,更准确的说法是长期记忆的巩固。

2017年MIT的研究表明,在学习事件发生时,记忆痕迹同时在海马体和大脑皮层的长期存储位置形成。但在早期,皮层中的记忆痕迹处于沉默状态,无法被主动提取。只有当这些痕迹逐渐成熟后,才能独立于海马体被提取。这说明记忆巩固不是简单的信息转移,而是海马体和皮层并行处理、相互作用的结果。

传统的记忆巩固模型认为,新记忆最初依赖于海马体编码和短期存储,然后通过系统巩固逐渐转移到大脑皮层进行长期存储。

除了海马体,睡眠(特别是慢波睡眠)在记忆巩固中也扮演着重要角色,它通过“重放”白天的学习经历来加强和稳定记忆痕迹。

Agent 记忆借鉴人类记忆的部分

现在很多Agent把记忆分为以下三种,完全借鉴了人脑的分类方式。

情景记忆(Episodic Memory)就是记下某一次具体经历。比如“昨天下午在星巴克和王老师一起喝了杯拿铁”,这个记忆里包含了时间、地点、人物和当时的感受,主要解决When Where Who 这样的问题。

语义记忆(Semantic Memory)则是关于事实的知识。比如“拿铁是咖啡和牛奶混合的饮料”,这个知识不依赖于某次具体经历,而是作为一个客观事实存在。它回答的是What的问题。这种记忆通常是从多次类似经历中慢慢提炼出来的。

程序性记忆(Procedural Memory)是关于“怎么做”的记忆。比如你知道怎么冲泡一杯拿铁——怎么操作咖啡机,怎么打奶泡。这种记忆需要反复练习才能形成,但一旦学会了就很难忘记,就像骑自行车一样。它解决How的问题。

但是不同的是,人脑的记忆从来不是单一的。当我们想到“拿铁”这个词的时候,这三种记忆往往会同时被激活:我们知道它是什么(语义记忆),可能想起某次喝拿铁的经历(情景记忆),还知道怎么制作它(程序性记忆)。

所以这个分类其实是照猫画虎,没有真正实现智能和记忆的方式。

另外,在业务中,也要考虑需要,分为这三类也不完全合理。

Sein heißt werden, leben heißt lernen.

Der einfache Weg is immer verkehrt.