如何与 AI 编程智能体沟通：Claude、Codex、Antigravity、Grok Build

代码不再是瓶颈，沟通才是。本文介绍如何与 AI 智能体 Claude、Codex、Antigravity 和 Grok Build 协作，让你更快、更精准地交付，同时减少 token 消耗。

2026年6月13日

认真问问自己：上次开发功能时，你花了多少时间写代码，又花了多少时间向智能体解释你想要什么？如果你在用 Claude Code、Codex、Antigravity CLI 或 Grok Build，答案已经完全倒过来了。你几乎不再敲代码，而是在描述、纠正、确认。

这就是这份工作最深层的转变。瓶颈不再是打字速度或框架熟练度，而是你与智能体之间沟通的质量。

代码不再是瓶颈，沟通才是

二十年来，优秀开发者的标准是快速交付整洁代码。现在代码由智能体来写。真正拉开差距的，是你能否在第一次尝试就拿到正确结果，并且成本最低。

昨天                                 今天
┌────────────────┐                   ┌────────────────┐
│ Write the code │  ~80% of time     │ Describe the   │  ~80% of time
│                │                   │ intent         │
└───────┬────────┘                   └───────┬────────┘
        │                                    │
┌───────▼────────┐                   ┌───────▼────────┐
│ Describe the   │  ~20% of time     │ Agent writes   │  ~20% of time
│ intent         │                   │ the code       │
└────────────────┘                   └────────────────┘

Bottleneck: typing                   Bottleneck: communication

具体来说，新时代的优秀开发者不是写代码最多的那个，而是能做到以下几点的那个：

更快：在预期结果出来之前，来回的轮次更少。
更精准：智能体做的正是你要求的，而不是它自己的理解版本。
token 消耗更低：每一次多余的来回、每一次上下文的重复加载，都在花 token，也就是在花钱和时间。
回归更少：意图清晰，产生的 diff 就精准，而不是一次把三个地方都改坏的大重写。

一个模糊的提示词和一个精准的提示词，代价完全不同：

Vague prompt                         Precise prompt
"fix the cart bug"                   "In cart.ts, computeTotal()
                                      applies the discount before VAT.
                                      Flip the order: VAT first,
                                      then discount on the net total."
        │                                     │
        ▼                                     ▼
  3 round trips                          1 pass
  ~45k tokens                            ~12k tokens
  2 regressions                          0 regression

这正是 AgentsRoom 的核心价值：以最快的速度、正确的格式，把意图转化为可执行的指令，不重复上下文。下面是专门为此打造的各个功能模块。

1. 持久上下文：`CLAUDE.md` 与 `AGENTS.md`

在发出第一条消息之前，智能体需要了解它所在的环境：项目约定、架构、常见坑。也就是那些你不想每次会话都重新解释的内容。这正是上下文文件（CLAUDE.md、AGENTS.md）的作用，每个主流 provider 都会在启动时自动读取它们。

        Without context                With CLAUDE.md / AGENTS.md
┌─────────────────────────┐        ┌─────────────────────────┐
│ You re-explain the       │        │ The agent already knows: │
│ stack, the style, the    │        │  - the stack             │
│ folders... on EVERY       │        │  - the conventions       │
│ new prompt               │        │  - the files to avoid    │
│                          │        │                          │
│ = wasted tokens          │        │ = you go straight to     │
│   every session          │        │   the point              │
└─────────────────────────┘        └─────────────────────────┘

这是投入产出比最高的沟通投资：写一次，每次提示都在受益。我们的 CLAUDE.md 指南详细说明了该写什么、不该写什么。

2. 提示词库：同样的提示词不用写第二遍

你一定有一些反复输入的指令："对这个 diff 做安全审查"、"按照我们的规范给这个模块写测试"、"帮我起一个 Conventional Commits 的提交信息"。提示词库可以存储、整理这些提示词，两次点击就能注入任何智能体。

链式提示同样重要。通过链式提示词，你可以把一个繁重的任务拆分成按顺序依次触发的步骤，而不是扔给智能体一堵墙，让它只执行一半。

One giant prompt                 Linked prompts (chained)
┌──────────────────────┐         ┌─────────┐   ┌─────────┐   ┌─────────┐
│ "Do A, then B,        │        │ 1. A     │──▶│ 2. B     │──▶│ 3. C     │
│  then C, and don't    │        │  scoped  │   │  scoped  │   │  scoped  │
│  forget D..."         │        └─────────┘   └─────────┘   └─────────┘
│                       │
│ the agent forgets     │        each step verified
│ half of it            │        before the next
└──────────────────────┘

3. 技能库：把流程编码，不只是写段落

提示词说的是要做什么。技能说的是在这个项目里怎么做，一步一步，带着你的规则。技能库保存这些可复用的流程（SEO 审计、组件迁移、发布检查清单），并在合适的时机挂载给智能体。这是高度浓缩的沟通：不用重新解释一个十行的流程，挂上技能，智能体就按协议执行。

4. 草稿板：先打磨再发送

好的提示词是起草出来的，不是在冲动下即兴发送的。草稿板始终触手可及：粘贴一段报错、一段规格说明、一个想法，整理一下，构建好结构，等准备好了再发给智能体。少一些"等等我刚才说错了"，就少一些来回。

5. 用语音表达意图：语音听写与语音模式

说话比打字快三到四倍，而且描述意图时往往更自然。AgentsRoom 提供两种模式：

语音听写：将你的语音直接转录到输入框。说完，校对，发送。
语音模式：开启真正的双向对话，你说话，智能体大声回复，双手解放。

Keyboard   ████████████████████████  ~40 words/min
Voice      ████████████████████████████████████████████████████████████  ~150 words/min

适合描述预期行为、大声梳理架构思路，或者在双手忙着其他事时引导智能体。

6. 展示而不是描述：草图标注与截图发送

有些事用文字很难说清楚。"按钮偏左了，顶部间距有点奇怪，弹窗应该从这里打开"：一张图胜过一千个 token。

用草图标注，截取屏幕，加上箭头、框和备注，把这张视觉反馈发给智能体。
用截图发送，一个键盘快捷键截取区域，直接附到提示词里。

"Nudge that thing a bit          [annotated capture]
 to the right, I think,           ┌───────────────┐
 you know what I mean..."         │  ┌──┐  ←── here│
                                  │  │  │          │
   vague, interpreted             │  └──┘  too low │
                                  └───────────────┘
                                    precise, no ambiguity

7. 反馈闭环：智能体也会回复你

沟通不只是发送，还有倾听。当智能体需要你做决定时，AgentsRoom 会像消息应用一样把它标记为未读，并在桌面端和移动端通知你。你不用再盯着滚动的终端，是智能体来 ping 你。

        YOU                                        AGENT
         │   1. Context (CLAUDE.md / AGENTS.md)      │
         │ ────────────────────────────────────────▶ │
         │   2. Intent (text / voice / sketch)        │
         │ ────────────────────────────────────────▶ │  executes
         │   3. Status + question (unread badge)      │
         │ ◀──────────────────────────────────────── │
         │   4. Decision / correction                 │
         │ ────────────────────────────────────────▶ │
         ▼                                            ▼
   fewer tokens       fewer regressions          faster

详情见通知与未读消息。

8. 量化对话：token 用量统计

只有量化了才能优化。Token 用量统计按会话和智能体维度显示每次交互的消耗。你一眼就能看出哪类提示词在疯狂烧钱，哪类保持精简。沟通成本变成了可以测量的指标，不再靠感觉。

9. 跨 provider 沟通，不丢失上下文

用 Claude 做架构，用 Codex 做后端，用 Antigravity 或 Grok Build 推进某个快速迭代的功能：切换模型不应该意味着重新解释一切。多 provider 支持可以把一个正在运行的智能体从一个 provider 切换到另一个，并生成交接摘要（涉及的文件、会话活动、进度），让新的 CLI 从上一个停下来的地方接着干。

   Claude ──▶ [handoff summary] ──▶ Codex ──▶ [summary] ──▶ Grok Build
   (arch)        context kept        (backend)              (feature)

10. 让智能体互相沟通

最划算的沟通，有时是那些你根本不需要参与的沟通。三个模块来处理这件事：

团队协作：开发智能体把任务交给测试智能体，测试智能体把反馈发回来，形成闭环，你不用夹在每次交换中间。
智能体委派：昂贵的智能体把机械性任务（跑测试、在浏览器里检查）委派给更便宜模型上的智能体。不值得花高价 token 的工作就别花。
AgentsRoom MCP 服务器：你的智能体可以直接读写控制台（待办、提示词、终端、浏览器），与你的环境沟通，而不只是与你。

11. 随时随地沟通

灵感不会等你坐到 Mac 前。移动端与桌面端同步和远程控制让你能从手机上启动智能体、回答问题或确认 diff。离开桌子，沟通循环不会断。

总结：什么场景用什么方式

你想要...	AgentsRoom 功能	主要收益
不再重复解释项目背景	`CLAUDE.md` / `AGENTS.md`	每次会话节省 token
复用常用指令	提示词库	速度、一致性
拆分大任务	链式提示词	减少回归
把流程编码	技能库	可重复的精准度
快速自然地描述	语音听写 / 语音模式	输入速度
展示视觉问题	草图标注 / 截图发送	零歧义
知道智能体在等待	通知 / 未读消息	减少盯屏幕
控制成本	Token 用量统计	可量化的节省
切换 provider 不从头来	多 provider 支持	上下文保留
把引导工作外包出去	团队协作 / 委派 / MCP	减少来回
移动中也能操控	移动端 / 远程同步	连续性

结语：沟通是新时代的核心技能

工作的本质已经翻转。会写代码仍然有用，但胜负不再在那里分出。能快速、低成本交付的开发者和在来回中烧 token 的开发者之间的差距，在于他们与智能体沟通的质量：上下文设置得当、意图表达清晰、为正确的信息选择正确的渠道、反馈闭环不额外花你时间。

AgentsRoom 就是围绕这个理念构建的。不是又一个聊天客户端，而是一个驾驶舱，每个功能模块都是为了让你与 Claude、Codex、Antigravity 和 Grok Build 并行协作时，沟通得更好、更快、更省。

想试试？下载 AgentsRoom，连接你的 provider，看着每个功能的成本随着你沟通能力的提升而下降。想深入了解如何写好提示词，参考我们的编程提示词工程页面，或者浏览所有功能。

继续阅读

下载 AgentsRoom

在一个窗口中运行你所有项目的 AI 智能体（Claude、Codex、Antigravity CLI、OpenCode、Aider、Grok Build、Mistral Vibe、Kimi Code）。

配套应用：随时随地监控你的 Agent

使用 Claude、Codex、Antigravity CLI 或其他 AI 提供商。

获取扩展

Chrome Web Store

把 Bug 和需求直接发送到您的公开待办清单。

AgentsRoom 实际运行一瞥。

多项目管理

多供应商

多代理运行

实时状态

文件差异与提交

移动应用

实时预览

代理团队

浏览器自动化

Backlog 驱动开发

提示词库

技能库

查看所有功能

如何与 AI 编程智能体沟通：Claude、Codex、Antigravity、Grok Build

代码不再是瓶颈，沟通才是

1. 持久上下文：`CLAUDE.md` 与 `AGENTS.md`

2. 提示词库：同样的提示词不用写第二遍

3. 技能库：把流程编码，不只是写段落

4. 草稿板：先打磨再发送

5. 用语音表达意图：语音听写与语音模式

6. 展示而不是描述：草图标注与截图发送

7. 反馈闭环：智能体也会回复你

8. 量化对话：token 用量统计

9. 跨 provider 沟通，不丢失上下文

10. 让智能体互相沟通

11. 随时随地沟通

总结：什么场景用什么方式

结语：沟通是新时代的核心技能

继续阅读

把 PDF 转成 Markdown 以节省 LLM token：MarkItDown 实战指南

AI 智能体循环：自我纠错的编码智能体如何把活干完

AgentsRoom 现已登陆 Windows

下载 AgentsRoom

代码不再是瓶颈，沟通才是

1. 持久上下文：CLAUDE.md 与 AGENTS.md

2. 提示词库：同样的提示词不用写第二遍

3. 技能库：把流程编码，不只是写段落

4. 草稿板：先打磨再发送

5. 用语音表达意图：语音听写与语音模式

6. 展示而不是描述：草图标注与截图发送

7. 反馈闭环：智能体也会回复你

8. 量化对话：token 用量统计

9. 跨 provider 沟通，不丢失上下文

10. 让智能体互相沟通

11. 随时随地沟通

总结：什么场景用什么方式

结语：沟通是新时代的核心技能

继续阅读

把 PDF 转成 Markdown 以节省 LLM token：MarkItDown 实战指南

AI 智能体循环：自我纠错的编码智能体如何把活干完

AgentsRoom 现已登陆 Windows

下载 AgentsRoom

1. 持久上下文：`CLAUDE.md` 与 `AGENTS.md`