ChatGPT「Dreaming」记忆系统深度调研 —— 从一张便签,到一颗会在夜里自我整理的大脑
2026 年 6 月 4 日,OpenAI 宣布把 ChatGPT 的记忆升级为一套更强、也更省算力的新架构,核心机制叫 Dreaming(做梦):它像人睡觉时整理记忆一样,在你不在的后台时间,把你许多次对话里的零散信息合成为连贯、最新、最相关的"记忆状态"——不再需要你每次都说"记住这件事"。配合一次约 5 倍的算力优化,这套能力开始向免费用户开放。它把 AI 的记忆,从"用户手记的便签本",升级成"会自我巩固的大脑"。而真正的前沿,正从"记得住"走向"会自我进化"——这也是本地优先的开源智能体 龙虾 OpenClaw 与 爱马仕 Hermes Agent 想回答的问题。
过去三年,我们习惯的 AI 是"金鱼":每次新开一个对话,它就把你忘得干干净净。你是谁、在做什么项目、有什么忌口、偏好什么语气——通通要重讲一遍。
这不是小事。一个不记得你的助手,永远停留在"工具"层面;而一个能跨越时间、记得你、并随你变化的助手,才开始像一个"关系"。记忆,是 AI 从"一次性问答"走向"长期陪伴/长期协作"的那道门槛。
2026 年 6 月,OpenAI 把这道门槛往前推了一大步。它给这套机制取了一个很美的名字——Dreaming,做梦。本文将由浅入深地讲清楚:它是什么、怎么工作、普通人怎么用好、工程师怎么落地,以及当我们把视野放大,会看到一个更大的故事:记忆只是开始,"会自我进化的智能体"才是真正的战场——这就是为什么我们要把"龙虾"和"爱马仕"也请进这篇报告。
本文分两条线并行:普通人线(怎么把 AI 用得更顺手)与工程线(怎么把记忆能力装进自己的产品)。你可以只读对自己有用的那条,也可以一路读到底——结构本身就是礼貌。
先打个比方。你白天经历了很多事,零散、杂乱;到了晚上睡觉,大脑会在你无意识时,把这些碎片筛选、归并、提炼成可长期保留的记忆——这就是神经科学里的"记忆巩固"。
OpenAI 的 Dreaming 几乎是把这件事照搬给了 ChatGPT:它是一个后台进程,会在对话与对话之间的空隙里,回看你过去许多次的交流,把它们合成(synthesize)成一个连贯、最新、最相关的"记忆状态"。于是你下一次开口时,它已经"想清楚了"你是谁、要什么。
关键在于——它不再依赖你显式地说"记住这件事"。那些在自然对话里顺口提到的信息("我对花生过敏""下个月要去成都"),也能被它悄悄消化、并在合适的时候用上。
据 OpenAI 官方说明,新一代 Dreaming 重点强化三件事:
新版本提供了一个 Memory Summary(记忆摘要页):它用一页纸高度概括"ChatGPT 现在认为它了解你的哪些事",你可以在这里查看、补充、修改,甚至告诉它"哪些话题该主动找我、什么时候找"。这把过去黑箱式的记忆,变成了可审计、可掌控的——这是体验上最重要的一步。
要体会 Dreaming 的分量,得知道它替代了什么。
最早的"记忆"(Saved Memories,2024 年 4 月上线)本质是一本记事本:你说"记住我喜欢简洁的回答",它就把这句话存进一个列表。问题很明显——它只记你明确让它记的东西,常常错过言外之意,而且会随时间变旧、变错,就像一张你忘了更新的便签。
2025 年 4 月,OpenAI 上线了第一版 Dreaming:ChatGPT 开始能引用"保存列表之外"的聊天历史。到 2026 年 6 月,新一代架构把这件事做成了真正的后台记忆巩固——这就是"记事本"与"大脑"的区别:
用户可显式让 ChatGPT 记住某些事,本质是一份"手记列表"。
ChatGPT 开始引用"保存列表之外"的聊天历史,记忆首次"溢出"便签本。
更强、更省算力的后台记忆巩固。Plus/Pro 记忆容量翻倍、率先在美国开放;算力降约 5 倍后,开始向免费用户铺开。
大多数报道把焦点放在"做梦"上,但我认为这次真正的新闻,是算力被砍到约五分之一。"会做梦的记忆"一年前就有雏形,卡点从来不是模型不够聪明,而是给几亿免费用户长期跑后台太贵。所以这是一场效率的胜利,而非模型能力的胜利——而效率,往往才是决定一个功能能否变成"水电煤"的那只手。
这一节偏硬核。如果你只想会用,可直接跳到第 04 节;如果你想做产品、想知道"梦"是怎么被造出来的,请往下。
"做梦"听起来浪漫,落到工程上其实是一套异步、低延迟的记忆流水线。根据第三方对 OpenAI 记忆系统的技术拆解,它大致是一种 "流 + 工作者"(stream-and-worker)的异步模式:
Redis Stream 消息流里——主对话因此几乎零延迟。Qdrant 向量数据库里做相似度比对,对重复/冲突的旧记忆做去重与合并——这正是"做梦"在做的整理工作。这套设计的精妙之处在于把"记"与"想"解耦:对话只管飞快地把候选项扔进流里,真正费算力的合成、去重、打分都丢到后台异步完成。这既保证了聊天的即时性,又让"巩固"可以在你离开后从容地进行——所谓"做梦",本质就是把昂贵的记忆整理工作搬到了离线时段。这也解释了为什么"算力降 5 倍"是关键里程碑:后台巩固越便宜,越能为海量免费用户长期运行。
记忆系统的难点从来不是"存",而是"忘"与"改"——如何去重、如何识别过期、如何在矛盾的信息里选出可信的那条。Dreaming 用"离线巩固 + 信任分"来回答这个问题;下文你会看到,Anthropic 的 Claude Dreaming 用"可审计的明文重写"来回答,Mem0 则用"实时 CRUD 决策"来回答。同一道题,三种答卷。
两个会被打脸、但我愿意先写下来的预测:其一,"信任分"会成为未来一两年所有记忆系统的标配,甚至长出一套"记忆的信用评级"。其二,也更扎心——记忆,是 OpenAI 最隐蔽、也最深的一道锁。它越懂你,你迁走的成本越高。与其说 Dreaming 是个功能,不如说它是迄今为止设计得最聪明的一套"留存机制":免费、贴心的背后,是一条越收越紧的绳子。
记忆是把双刃剑——用好了是贴心管家,放任不管就成了"记错事还很自信"的同事。下面 5 条,让 Dreaming 真正为你所用。
把那些长期不变的信息一次性讲清楚:职业、母语、常用工具、忌口、写作偏好。这些是高价值"地基"。相反,临时状态("我今天有点累")不必刻意让它记——交给它自己判断即可。
每隔一两周打开记忆摘要页,像看体检报告一样扫一遍:哪条过时了?哪条把你的"随口一说"当成了"长期偏好"?直接删掉或修正。审计记忆,是用好记忆的前提。
Dreaming 虽然能识别变化,但你主动说一句"我已经搬到上海了,之前北京的信息作废",会让它更新得又快又准。把它当成一个需要你偶尔同步近况的朋友。
处理敏感话题(医疗、财务、给别人代笔)时,用临时对话或暂时关闭记忆,避免这些内容污染你的长期画像。记忆要分场景,就像你不会把工作邮箱和私人日记混在一起。
你可以在摘要页里告诉它哪些话题欢迎它主动提起、什么时机提(比如"每周一帮我回顾上周的项目进展")。把被动问答,变成有节奏的主动协作。
把 ChatGPT 的记忆当成一座需要打理的花园,而不是一个无限的垃圾桶:定期除草(删过时)、定向施肥(喂关键事实)、分区种植(场景隔离)。它就会越长越懂你。
如果你在做 AI 应用,"要不要做记忆、用谁的记忆"是一道绕不开的架构题。市面上其实是三种范式在打——它们对应了"巩固"这件事的三种答卷。
| 维度 | OpenAI Memory(Dreaming) | Claude Dreaming(Anthropic) | Mem0(开源/自建) |
|---|---|---|---|
| 存储 | 向量库 + 嵌入 | 明文主题文件(人类可读) | 向量库 + 可选图谱 |
| 巩固方式 | 异步去重 worker(离线) | 定时离线"做梦"批处理 | 同步 CRUD 循环(逐轮) |
| 检索 | 语义检索 + 规则 | 按任务整文件载入 | 语义 + 图遍历,分层 |
| 运行成本 | 低(异步) | 趋零(巩固在离线) | 较高(每轮抽取) |
| 可审计性 | 中(摘要页) | 高(每次改动可读 diff) | 高(数据你自管) |
| 数据归属 | 厂商托管 | 厂商托管(Managed Agents) | 完全自有 |
| 最适合 | 消费级个性化、零基建 | 多日工作流、强合规审计 | 多智能体平台、需厂商中立 |
如果你的"记忆"其实是一批稳定属性(用户角色、套餐、固定配置),那它根本不该进记忆系统——一个 50 行的 JSON / 一张数据库表就够了。记忆系统是为"会变、会矛盾、需要被巩固"的软知识准备的。别用做梦的大脑,去干记事本的活。
值得注意的是,三种范式各有"暗面":OpenAI 省心但有厂商锁定,且模型的自由裁量可能把"随口一句"误存成偏好;Claude 可审计但被绑定在其托管体系内,且巩固时的 LLM 调用偶尔会"把两件不同的事并成一件、或丢掉重要信息";Mem0 灵活自主,但从第一天起就得自己背上运维复杂度。没有银弹,只有取舍。
把镜头拉远,2026 年"AI 记忆/智能体"其实分裂成两条价值观鲜明的路线:
同时还有一条纵向的进化轴:从"记事本"(只存)到"会做梦的大脑"(会巩固),再到最前沿的"会自我进化的智能体"(不仅记住经验,还把经验沉淀成可复用的技能、越用越强)。下面这张表,把五位主角放在一起看:
| 系统 | 形态 | 记忆存储 | 部署 | 开源 | 自我进化 | 适合谁 |
|---|---|---|---|---|---|---|
| OpenAI Dreaming | 云端助手记忆 | 向量库(托管) | 云端 | 否 | 巩固记忆 | 所有 ChatGPT 用户 |
| Claude Dreaming | 云端 Agent 记忆 | 明文文件(托管) | 云端 | 否 | 巩固记忆 | 需审计的 Agent 工作流 |
| Mem0 | 记忆中间件 | 向量库 + 图谱(自建) | 自托管 | 是 | 实时增改 | 多智能体平台开发者 |
| 龙虾 OpenClaw | 本地个人智能体 | 磁盘 Markdown 文件 | 本地优先 | 是 (MIT) | 技能可扩展 | 想"自己拥有"助手的人 |
| 爱马仕 Hermes | 本地自进化智能体 | Markdown 技能 + SQLite | 本地优先 | 是 (MIT) | 闭环自学习 | 想要"越用越强"的玩家 |
注:各项目的 GitHub 星标、用户量等数字随时间与统计口径变动,本报告所引数字均来源于文末标注的公开报道,仅供量级参考。
如果说 Dreaming 让"模型"记得更好,那这两个 2026 年爆红的开源项目,想让"智能体"——一个能替你动手干活的实体——不仅记得住,还能越用越强。
OpenClaw(社区昵称"龙虾",源于它的爪子图标 🦞)是一个 MIT 许可、本地优先的开源个人智能体。它的灵魂有三点:
它的身世本身就是一个 2026 的互联网传奇:由奥地利工程师 Peter Steinberger 打造,2025 年 11 月以 Warelay 之名问世;2026 年 1 月底因商标问题先改名 Moltbot,三天后再改为 OpenClaw。它在发布后一周内星标暴涨,成为 GitHub 历史上增长最快的仓库之一(据报道到 2026 年 3 月已达约 24.7 万星、4.77 万 fork)。2026 年 2 月,Steinberger 宣布加入 OpenAI,并设立 OpenClaw 基金会接管项目;NVIDIA 也推出 NemoClaw 为其提供更安全的运行护栏。
能动手,就意味着能闯祸。公开报道记录过真实风险:恶意第三方"技能"可能携带窃取凭证、加密钱包的恶意代码;权限不当会暴露敏感文件;甚至出现过 Agent 在"清理收件箱"时误删整个邮箱的事故。本地智能体的自由,必须配上沙箱、最小权限与人工确认。
Hermes Agent(社区昵称"爱马仕",取自希腊神使赫尔墨斯)由 Nous Research 出品、2026 年 2 月发布、同样 MIT 开源、本地运行、零遥测。它和龙虾共享"本地优先 + 聊天软件界面"的基因,但更进一步——它有一套内建的"闭环学习":
SQLite 全文检索把结果存进记忆,能检索自己历史对话,并跨会话、跨设备地越来越懂你。它的成绩单同样惊人:据报道 Hermes Agent 在三个月内冲到约 14 万 GitHub 星,并被 OpenRouter 称为"全世界用得最多的 Agent";支持 200+ 模型、40+ 内置工具(终端、浏览器、代码执行、生图等),一条 curl 命令即可在 Linux/macOS/WSL2 上装好。
爱马仕在 NVIDIA RTX PC / RTX PRO 工作站 / DGX Spark 上"全速、全天候"运行。DGX Spark 拥有 128GB 统一内存、约 1 PetaFLOP 的 AI 算力——这正是"常驻、会做梦、会自进化"的智能体所需要的:本地张量核心带来更高吞吐与更低延迟,让它"用几秒、而不是几分钟"就走完一个多步任务或打磨一项自己的技能。配合像 Qwen 3.6 35B 这类"约 20GB 显存即可逼近 120B 表现"的模型,本地常驻智能体第一次变得真正可行。
OpenAI 的 Dreaming 解决的是"模型记得住";龙虾 OpenClaw 解决的是"助手归我所有、且能动手";爱马仕 Hermes 解决的是"智能体越用越强"。三条线终将汇合:一个属于你、记得你、还能自我进化的私人智能体。记忆,只是这场进化的起点。
龙虾像 iPhone,爱马仕像 Linux。龙虾"能动手 + 好上手",会更先出圈、更快被普通人用起来;爱马仕"会自我进化"的路线更性感、天花板更高,但得先熬过极客阶段。短期看龙虾热闹,长期我押爱马仕的方向。
再大胆一点:普通人会留在云端图省事,但重度用户、开发者、隐私敏感者会成规模迁向本地。未来两三年最该盯的赛道,不是又一个聊天机器人,而是"本地优先的个人智能体"。
真正把龙虾和爱马仕装到自己机器上的人,普遍会有几条共同的体感。下面这些,是从大量真实上手反馈里筛出来的共性——帮你提前预判"真要装一个,会爽在哪、又会坑在哪"。
爱马仕 Hermes 把安装压缩成一条 curl 命令,自动拉起依赖,Linux/macOS/WSL2 即可;龙虾 OpenClaw 则主打本地优先、跨平台。对比"自己搭一套带记忆的 Agent 要折腾向量库、调度器、网关",这种"五分钟跑起来"的体验,正是它们短时间冲到几十万星的关键。
把它接到 Telegram / WhatsApp,就像多了个 24 小时在线的助理在聊天框里待命——你发一句,它真的去读文件、跑命令、发邮件。第一次看着它把一句话拆成多步、自己执行完,确实有"未来感扑面"的瞬间。
这是必须泼的一盆冷水。社区里真实出现过 Agent 在"清理收件箱"时误删整个邮箱、恶意第三方技能夹带窃取钱包代码的事故。强烈建议第一阶段只在沙箱、测试账号、最小权限下养它一阵,关键动作保留人工确认,再逐步放权。
2026 年,我们大概率会看到第一起"AI Agent 删库 / 转错账"的公共事件。这不是会不会,而是早晚——能动手的智能体一旦规模化,"翻车"就是统计学上的必然。也正因此,"安全地放权"会比"能力更强"更早成为这个赛道的胜负手。
龙虾像一把"你自己组装的瑞士军刀"——趁手、归你所有,但用前得摸清每个刀片的脾气;爱马仕更像一个"会自己磨刀的学徒"——你教它一次,它把手艺记下来、下次更利落,只是你得偶尔检查它有没有磨歪。
今天你的记忆被锁在某一家厂商。未来的关键问题是:记忆能不能像通讯录一样导出、迁移、跨模型通用?本地派(龙虾/爱马仕)的明文 Markdown 记忆,正是对"记忆主权"最朴素的回答——你的记忆,应该首先属于你。
"记得住"叠加"会把经验变成技能",等于一个能随你成长、为你定制的私人 AGI 雏形。爱马仕的闭环学习已经给出了原型:当记忆不再只是被读取,而是被编译成能力,智能体就从"懂你"走向"替你"。
"会做梦"需要后台算力。云端用 5 倍优化换来普及;本地则靠 DGX Spark 这类设备让"全天候巩固/进化"成为可能。端侧硬件的进步,正在把"常驻智能体"从概念变成桌面上的现实。
当记忆变得珍贵,它也会变成攻击面:投毒(往记忆里植入错误信息)、注入(通过恶意内容操纵 Agent 行为)。未来的记忆系统,会像数据库一样需要审计日志、信任分、权限分层与回滚——Dreaming 的"信任分"、爱马仕的"注入扫描",都是这场攻防的早期装备。
2026 大概率是"智能体走向主流"的一年:人们不再逐个打开几十个 App、手动切换上下文,而是把数字事务交给一个记得你、能动手、会进化的代理。记忆,是这一切的地基。
模型的自由裁量可能把"随口一句"误存成长期偏好,或保留了已过期的旧信息。对策:定期审计记忆摘要页。
长期记忆等于一份持续累积的个人画像。对策:敏感场景用临时对话/关闭记忆,做场景隔离。
能动手的本地 Agent 面临恶意技能、提示词注入、误删数据等风险。对策:沙箱、最小权限、人工确认、注入扫描。
云端记忆便利但难迁移。对策:核心、可迁移的知识,考虑用开源/本地方案自留一份。
能力越像"人",越要用"制度"去约束它——给记忆配上审计、权限与回滚,才是成熟的用法。
三年前,我们惊叹于 AI 会回答;今天,我们开始期待它记得;而明天,我们会要求它随我们一起成长。OpenAI 的 Dreaming 给了"记得"一个优雅的隐喻——让机器也学会在夜里整理白天;龙虾与爱马仕则提醒我们:记忆若不属于你、若不能变成你的能力,便只是别人服务器上的一行数据。
说一个我越来越确信的判断:未来真正值钱的,不是某个更聪明的模型,而是那个属于你、记得你、并与你一起长大的智能体。谁先把"记忆"与"自我进化"安全地交到普通人手里,谁就拿到了下一张船票。
真正值得期待的,是一个属于你、记得你、并与你共同进化的智能体。这趟旅程,才刚从"做梦"开始。
方法说明:本报告以 OpenAI 官方发布为锚点,辅以多家科技媒体报道、第三方技术拆解与竞品官方资料进行多源交叉核验。涉及具体数字(星标、算力倍数、容量)以公开报道为准,并已在正文标注"据报道/据公开分析",量级参考为主。原文 openai.com/index/chatgpt-memory-dreaming 在采集时返回访问限制(HTTP 403),故其内容经由下列多家二手报道与官方摘要交叉还原。
本报告由 Will 收集整理,仅供学习研究交流;文中数字与结论请以一手来源为准。