从聊天窗口到运行循环:Codex 如何重新定义知识工作
数字经济
数字经济 > 正文

从聊天窗口到运行循环:Codex 如何重新定义知识工作

Codex 已经不只是一个编程助手。 2026 年 5 月,它的周活跃用户突破 400 万,其中 50% 的使用场景已经不是写代码。它正在变成一个可以承载长期任务、沉淀记忆、周期执行并跨工具协作的工作平台。

「置顶线程 + 上下文压缩」是核心范式转变。 工作不再是「一问一答」,而是一个可以运行数月的持久对话空间,积累历史、偏好和决策记录。

Heartbeats(心跳自动化)让 Agent 学会了「不等人」。 它可以每 30 分钟检查一次 Slack 和 Gmail,可以每 15 分钟监控一个反馈线程,甚至可以帮你排队等客服、拿退款。

记忆系统的关键不是「记住」,而是「写下来」。 用 Obsidian vault + Git diff 把线程中有价值的信息序列化成文件,才是长期可复用的知识资产。

远程控制 + 手机审阅让工作真正脱离桌面。 5 月 14 日起,iOS 和 Android 均可通过 ChatGPT 移动端操控 Codex 会话,审阅产物、批准命令、改变方向。

Goals(目标模式)是从「prompting」到「assigning」的跃迁。 给出明确验证标准,Agent 可以自主循环运行数小时甚至 14 小时不间断。

侧边面板是 Codex 成为「工作发生之处」的关键界面。 它不只预览产物,更是检查、标注、交互和审阅变更的统一空间。

一个数字先摆在这里

400 万。

这是 OpenAI 在 2026 年 4 月底公布的 Codex 周活跃开发者数量。两周前还是 300 万。再往前推,2026 年 1 月到 4 月之间,ChatGPT Business 和 Enterprise 里的 Codex 用户量增长了 6 倍。

速度快到什么程度?Codex 桌面应用上线第一周,下载量就突破了 100 万。到了 5 月中旬的 Codex App 发布时刻,OpenAI 甚至对所有 ChatGPT Free 和 Go 用户限时开放了访问权限,Plus 和 Pro 用户的速率限制直接翻倍。

这不是一个「程序员圈子里的小工具」的增长曲线。这是一个正在吞噬工作本身的产品的增长曲线。

问题来了:400 万人涌进来,他们到底在用 Codex 做什么?

答案可能出乎很多人意料——50% 的用户使用场景已经不是写代码。

谁在用,怎么用

Jason Liu 是 OpenAI Codex 团队的工程师。5 月 17 日,他在个人博客发布了一篇名为「Codex-maxxing」的使用手记,记录了他如何将 Codex 从编程工具推向全面的知识工作平台。

这篇文章在 X 上发布 24 小时内获得 8800 次浏览、225 次收藏,评论区情绪 100% 正面。这不是一篇营销稿,而是一个深度用户的真实工作日志。

他的用法让我意识到一件事:大多数人还在用 Codex「问问题」,而真正从中获得杠杆的人,已经在用它「运行工作」。

区别在哪?

问问题是:我给你一个 prompt,你给我一个答案,对话结束,任务中断。

运行工作是:我给你一个空间,你在里面持续推进,我随时可以回来检查、引导、修正,任务永远不需要从零开始。

这才是 Codex 2026 年真正在卖的东西。不是更好的代码生成能力,而是工作的连续性。

持久线程:不是聊天记录,是工作站

第一个改变一切的功能,叫上下文压缩。

传统的 AI 对话有一个致命弱点:上下文窗口是有限的。对话越长,信息丢失越多,最终变成一个失忆的助手。Codex 的解法是上下文压缩——允许线程在保留核心信息的前提下无限延伸。

Jason Liu 的做法是:为每一个重要工作流保留一个置顶线程。

他有一个「Chief of Staff」线程,专门负责收件箱和 Slack 的分拣。有一个「Agents SDK」线程,跟踪开源项目进展。有一个「Open Source」线程,管理社区贡献。还有一个专门监控 Twitter 的线程。

这些不是短对话。它们是运行了几个月的巨型线程,积累了大量历史、偏好和过去的决策。

快捷键 Command-1 到 Command-9,直接跳转。

你可能会问:这不就是把聊天记录变长了吗?

不。长度不是重点。重点是这些线程开始像「工位」一样运作——每一个线程都有自己的领域、自己的记忆、自己的运行节奏。你不再是在「和 AI 聊天」,你是在「回到某个正在进行中的工作」。

当然,代价是存在的。长线程脱离缓存后,再次加载的成本更高。但对于真正重要的工作流来说,连续性的价值远远超过成本。

语音输入 + Steering:让 Agent 拿到你的真实想法

语音输入在 Codex 中不是一个「方便打字」的功能。它的真正价值是让 Agent 拿到你未经编辑的思考原貌。

Jason Liu 举了一个例子。如果他在规划工作时说:「我记得 Slack 里有个叫 Ben 的人提过这事,我不太记得具体是什么,你去找一下。」这句话如果打出来,会显得模糊又烦人。但说出来却非常自然。而 Agent 完全能处理这种模糊指令。

更有意思的是 Steering 功能。它允许你在 Agent 工作时持续追加意图。比如你在审阅一个网站,一边看一边说:

把这个调小一点

这句文案不对

间距不舒服

完成后开个 PR

等部署完成

把预览链接发到 Slack

你不需要等每一步完成后再决定下一步。你可以在 Agent 还在执行时,把接下来要做的事全部排好队,然后离开。

这改变了什么?改变了人与 Agent 之间的关系。你不再是一个「每次只能发一条消息然后等回复」的用户。你变成了一个可以持续输入意图、然后让系统自己排队执行的指挥者。

记忆:不是记住对话,是写成文件

一旦线程开始长期存在,一个新问题浮出水面:跨线程的知识怎么共享?

Codex 有第一方记忆功能(Settings > Personalization > Memories),但 Jason Liu 的做法更进一步。他用一个 Obsidian vault 作为 Agent 的「居住地」:

vault/

在最上层的 AGENTS.md 指令里写明:当你对某个人有更多了解、推进了某个项目,或者关闭了一个待办循环时,请更新 vault 里对应的页面。

然后把这个 vault 作为 GitHub 仓库维护。

为什么?两个理由。

第一,它可以在云端运行,不绑定本地环境。

第二——这是关键——diff 成为审阅记忆的界面。

当 Agent 更新 vault 时,你可以阅读 Git diff,看看它认为哪些信息重要到值得被记住。这个审阅步骤至关重要。你不希望一个长期线程悄悄在对话历史里积累一种模糊的「感觉」。你希望它把真正发生变化的事情写下来:某人的偏好、某个项目在等什么、某个决定已经做出、某个循环已经关闭。

记忆系统的意义不在于「记住更多」。在于把经验压缩成一种能够脱离线程继续存在的形式。如果线程消失了、压缩得很糟糕,有用的知识仍然在文件里。

Chronicle 是 OpenAI 在 4 月 20 日推出的另一种记忆方案——通过后台截取屏幕内容来构建上下文记忆。Sam Altman 说使用体验「像心灵感应」。但它也有真实取舍:截图经过 OpenAI 服务器处理后本地存储为未加密的 Markdown 文件,增加了提示注入攻击面。目前是需要主动开启的研究预览功能。

方向是对的,但还不够成熟。文件系统仍然是最可靠的记忆基础设施。

Heartbeats:让 Agent 学会主动工作

这可能是 Codex 最有颠覆性的功能。

Heartbeat 是一种线程本地的定时自动化。你可以对一个线程说:「每隔几个小时帮我看一下这个。」然后它就会按照这个节奏自动运行。

Jason Liu 的 Chief of Staff 线程每 30 分钟运行一次:

每 30 分钟检查 Slack 和 Gmail,看看有没有需要注意但未回复的消息。帮我判断优先级。如果有人问我问题,尽可能研究答案并草拟回复,但不要发送。

当他回到 Slack 时,很多回复已经在草稿里了。最费力的上下文收集已经完成。他只需要决定哪些要发送。

另一个例子更生动。他在做一个动画项目,把视频发到 Slack 让同事审阅,然后让 Codex 每 15 分钟检查一次线程。如果有评论,就重新渲染新版本并回复。因为 Slack MCP 服务器不支持文件上传,Agent 就用 @computer 能力去点击「Add file」按钮,把文件传了上去。

注意这里发生了什么:一个反馈循环横跨了 Slack(收集反馈)、Remotion(渲染动画)和 @computer(上传文件)三个工具边界。Agent 在人离开后自己维持了这个循环。

还有一个更极端的例子。他的包裹被偷了,Amazon 说要等 25 分钟才能接通人工客服。他创建了一个带 @computer 的线程:每 5 分钟检查客服是否加入,如果加入就争取退款,并把频率提高到每分钟一次。然后他去洗澡了。洗完澡出来,退款处理完毕。

这不是科幻。这是 2026 年 5 月正在发生的真实使用场景。

远程控制:工作不再绑定桌面

5 月 14 日,OpenAI 正式将 Codex 推送到 ChatGPT 移动应用。iOS 和 Android 均可用。所有 ChatGPT 计划都支持,包括 Free 和 Go。

TechCrunch 的报道引用了 OpenAI 的声明:「这不只是远程控制单个任务或分派新任务。从手机端,你可以跨所有线程工作、审阅产物、批准命令、切换模型或启动新任务。」

执行和凭据留在桌面机器上。手机端只负责审阅、批准和引导。

这和 Heartbeats、置顶线程形成了一套完整的链路:

你在桌面启动一个长期任务

Heartbeat 让它按节奏自动运行

你离开桌面,用手机查看进展

在关键决策点介入引导

工作继续推进

工作不再因为你换了地点而暂停。这是真正的异步工作流。

Goals:从 prompting 到 assigning

Goals 是 Codex CLI 0.128.0 引入的 /goal 命令。它让 Agent 进入一个自主循环:plan → act → test → review,直到满足你定义的成功条件或额度耗尽。

一个弱目标是:「执行这个 Markdown 文件里的计划。」

一个强目标是:「把 Python Rich 库迁移到 Rust,必须通过原 Python 库的所有单元测试。」

后者有真正的验证标准。Agent 可以自己判断是否完成、哪里失败、需要怎么修复。

有人用 /goal 让 Codex 在一个设备驱动项目上连续运行了 14 小时。还有人用它在一小时内完成了一个完整游戏的构建。

关键区别在哪?

如果你只给 Agent 一个模糊的计划,它最多是一个努力的实习生。如果你给它一个带有清晰验证标准的目标,它就变成了一个可以自我修正的执行者。

没有验证的野心,只是愿望。这句话适用于 Agent,也适用于人。

侧边面板:工作发生的地方

很多人把侧边面板理解为「预览窗口」。这大大低估了它。

侧边面板做三件事:

检查产物。 Markdown 可评论,电子表格可渲染公式并支持单元格编辑,CSV 显示为表格,PDF 直接渲染(LaTeX 用户的福音),幻灯片可在应用内审阅。关键不只是 Codex 能生成这些东西,而是你可以在不打断循环的情况下检查和标注它们。

操作网页界面。 Agent 可以通过 $browser 用 JavaScript 控制应用内浏览器,你可以直接在浏览器渲染的内容上留标注。最小且最持久的版本是一个带 JS 和 CSS 的单文件 index.html——不需要服务器,打开即用。Storybook 审阅组件,Remotion Studio 做动画,Slidev 做演示文稿,Streamlit 做数据应用,都可以在这个空间内完成。

审阅变更。 diff、PR 评论、代码修改——全部可以在同一个界面内完成。

当侧边面板上的内容和 Agent 操作的对象是同一个东西时,你们之间的协作效率会质变。你不再需要在聊天窗口和实际产物之间来回切换。产物本身就是对话的一部分。

定位与定价:它在卖什么

2026 年 4 月 2 日,OpenAI 将 Codex 的定价从按消息计费改为按 API token 用量计费。

目前的结构是:

Codex 包含在所有 ChatGPT 计划中(Free、Go、Plus、Pro、Business、Enterprise)

企业用户可以添加「Codex-only 席位」,按用量付费,无固定席位费

OpenAI 估计平均每个开发者每月花费 100–200 美元

新用户团队注册时还能获得最高 500 美元的信用额度。

这个定价策略很清晰:先让人用起来,再通过用量收费。一旦你的工作流跑在 Codex 上——线程积累了记忆,Heartbeats 在后台运行,vault 里沉淀了上下文——迁移成本就变得极高。

这不是 SaaS 的逻辑。这是基础设施的逻辑。

真正的转变

让我把这些碎片拼起来。

过去的 AI 使用模式是这样的:

用户提需求 → 模型给结果 → 对话结束 → 任务中断 → 下次重新开始。

Codex 正在构建的模式是这样的:

用户设定目标 → 线程持续运行 → 记忆沉淀为文件 → Heartbeats 周期执行 → 用户随时介入审阅 → 工作永不归零。

从「一问一答」到「运行循环」。从「能力」到「连续性」。从「聊天窗口」到「工作操作系统」。

这个转变的意义不在于 Agent 变得多聪明。而在于工作本身的组织方式变了。

过去,一个想法死在 prompt 之后是常态。你有了灵感,打开 ChatGPT,问了一个问题,拿到一个答案,然后关掉窗口。三天后你已经忘了这件事。

现在,一个想法可以被放进一个线程、配上记忆、设定心跳、挂上验证标准,然后持续推进。你不需要一直盯着它。你只需要偶尔回来看一眼 diff,确认方向没有跑偏。

这不是替代人的工作。这是让更多工作不再死在中途。

对于知识工作者来说,这可能是 AI 工具真正进入日常生产流程的关键一步。不是因为它变得更强了,而是因为它终于学会了「不下班」。

来源:0x9999in1,ME News