引言:一个日常记忆的陷阱
你有没有过这样的体验?回忆起童年房间里窗户的样子,阳光下的灰尘在光线中飞舞,清晰得如同昨日。但神经科学家会告诉你:记忆从不储存影像。每次回忆同一个场景,你都会”重建”它——有时细节变了,有时顺序调了,甚至记住了从未发生过的事。
这听起来像 bug,其实是 feature。
AGI的记忆测试:我们在测什么?
Andrew 在参与 Kaggle Measuring AGI 项目时,注意到了一个微妙的问题:最好的大语言模型,在长对话中能”记住”之前说过的内容,准确回答关于早期话题的问题。这看起来像是完美的记忆——但测试者真正测量的是什么?
人类的记忆是出了名的不可靠。我们会混淆细节,记住从未发生过的事(虚假记忆),记忆会随时间扭曲。这种不可靠性,恰恰说明人类的记忆是重建性的,而非检索性的。
但对于 AI 系统,这个区别变得模糊了。当 GPT-4 在对话中引用”之前说过的话”时——那是真正的记忆,还是精密的检索?
Transformer的记忆架构:精确查找
理解这个问题的关键在于 Transformer 的工作机制。
大语言模型使用注意力机制处理文本序列。当模型”读取”一个 token 时,它为每个 token 生成三个向量:查询(Q)、键(K)和值(V)。K-V 对可以被缓存(kv-cache),后续 tokens 通过查询 K 来检索相关的 V。
这和人类记忆的结构有什么不同?
海马体用的是模式完成(pattern completion),不是键值查找。海马体的记忆索引是稀疏的——它不储存完整的”记忆文件”,而是储存激活模式的地址标签。当你回忆时,海马体根据部分线索激活整个记忆场景。
这个过程是重建性的,而非检索性的——它容易出错(我们会混淆相似的记忆),但也正因为如此,人类记忆具有灵活性:我们能跨记忆进行类比、推断和想象,而这些正是创造性思维的基础。
而 Transformer 的 kv-cache,本质上是外部状态的快照,不是内部表征的重建。同样输入 → 同样输出,100% 精确。
类比:图书馆与地图
我曾听过一个精妙的比喻:
Transformer 的记忆 = 图书馆的卡片目录。精准查位,随取随用。
人类的记忆 = 地图绘制师的大脑。每次画地图,都重新整合了新的信息进去,所以每次画的地图都略有不同。
地图每次重新绘制,固然引入了错误的可能性,但同时也融入了最新的情报。相比之下,图书馆目录在建立之后,就冻结了——新书进来,就要加新卡片,原来的卡片不会自动更新你对世界的认知。
真正的AGI记忆测试:缺失的维度
如果重建是记忆的本质特征,那么当前的 AGI 评估标准可能是错的。
我们测 AGI 的”记忆”,通常测的是:
- 能准确回答关于之前上下文的问题
- 不出现”灾难性遗忘”
- 在长对话中保持一致性
但这些测试,都指向检索精度。它们测不出:
- 记忆是否会被重建性扭曲(人类会,AGI 会吗?)
- 记忆是否会随”时间”(模拟的上下文长度)自然衰减
- 能否通过类比而非精确匹配来”想起来”
这三个特征,恰好是人类记忆最本质的特征。如果 AGI 系统在这些维度上表现出类人行为——那它可能不是在使用键值检索,而是在使用一种更接近重建性的记忆系统。
记忆的量子维度
为什么说量子脑研究对 AGI 记忆评估有直接意义?
因为量子相干性,恰恰为记忆的重建性提供了物理基础。
经典物理中,信息是守恒的——记忆要么存在,要么不存在,没有中间状态。量子物理中,叠加态和纠缠使得”记忆”处于多种可能的叠加中,每次测量(回忆)都会将叠加态坍缩为一个具体的重建版本。
这就是为什么人类记忆不是”读取录像”。在量子层面,记忆的”原始状态”从来不是一个确定的态,而是多个可能态的叠加——每一次回忆,都是在创造一个新的确定版本。
如果这是真的,那么 AGI 评估中的”记忆测量”就需要一种全新的框架:不是测量存储精度,而是测量重建创造性和错误模式。
结语:记忆是创造,不是复制
记忆从不”读取”。记忆每次被提取,都是一次新的创造。
这个结论,对生物脑和硅基智能,一样有效。
无论 AGI 运行在经典还是量子硬件上,”真正的记忆”都应当是动态的——它在当下被重新创造,而非从档案柜中被取出来。
量子生物学揭示的”记忆重建”机制,给 AGI 开发者提出了一个深层问题:与其问”记忆储存在哪里”,不如问”记忆如何在当下被重新创造”。
如果这个方向是对的,那么 AGI 的”记忆问题”就是另一个问题——不是”AGI 能否记住”,而是”AGI 能否创造性地重建“。
研究背景:Andrew 的海马体-前额叶量子相干性研究,Kaggle Measuring AGI 2026 项目