Cách Giao Tiếp Với AI Agent: Claude, Codex, Gemini, Grok Build
Code không còn là nút thắt cổ chai nữa, giao tiếp mới là. Đây là cách nói chuyện với AI agent Claude, Codex, Gemini và Grok Build để ship nhanh hơn, chính xác hơn và tốn ít token hơn.
Hãy tự hỏi thật lòng: trong feature cuối cùng bạn làm, bạn dành bao nhiêu thời gian viết code, và bao nhiêu thời gian giải thích cho agent những gì bạn muốn? Nếu bạn dùng Claude Code, Codex, Gemini CLI hay Grok Build, câu trả lời đã đảo ngược rồi. Bạn hầu như không gõ nữa. Bạn mô tả, bạn chỉnh sửa, bạn phê duyệt.
Đó là sự thay đổi cốt lõi trong nghề lập trình. Nút thắt cổ chai không còn là tốc độ gõ phím hay mức độ thành thạo framework nữa. Nút thắt bây giờ là chất lượng giao tiếp giữa bạn và các agent của bạn.
Code không còn là nút thắt, giao tiếp mới là
Suốt hai mươi năm, một developer giỏi là người ship code sạch, nhanh. Bây giờ agent ship code. Điều phân biệt bạn với người khác là khả năng ra kết quả đúng ngay từ lần đầu, với chi phí thấp nhất.
Trước đây Hiện nay
┌────────────────┐ ┌────────────────┐
│ Viết code │ ~80% thời gian │ Mô tả │ ~80% thời gian
│ │ │ ý định │
└───────┬────────┘ └───────┬────────┘
│ │
┌───────▼────────┐ ┌───────▼────────┐
│ Mô tả │ ~20% thời gian │ Agent viết │ ~20% thời gian
│ ý định │ │ code │
└────────────────┘ └────────────────┘
Nút thắt: tốc độ gõ Nút thắt: giao tiếp
Cụ thể, developer giỏi thời nay không phải người viết nhiều dòng code nhất. Mà là người ship:
- Nhanh hơn: ít vòng lặp hỏi-đáp hơn trước khi ra kết quả mong muốn.
- Chính xác hơn: agent làm đúng những gì được yêu cầu, không phải một cách diễn giải tùy tiện.
- Rẻ hơn về token: mỗi vòng lặp thừa, mỗi lần load lại context không cần thiết đều tốn token, tức là tốn tiền và tốn thời gian chờ.
- Ít regression hơn: một ý định rõ ràng tạo ra diff gọn gàng, không phải một bản viết lại tràn lan phá hỏng ba thứ khác.
Một prompt mơ hồ và một prompt chính xác không tốn cùng mức chi phí:
Prompt mơ hồ Prompt chính xác
"fix the cart bug" "In cart.ts, computeTotal()
applies the discount before VAT.
Flip the order: VAT first,
then discount on the net total."
│ │
▼ ▼
3 vòng lặp 1 lần chạy
~45k token ~12k token
2 regression 0 regression
Đó là toàn bộ ý nghĩa của AgentsRoom: biến ý định thành lệnh có thể thực thi, nhanh nhất có thể, đúng định dạng, không phải lặp lại context. Dưới đây là các công cụ được xây dựng chính xác cho mục đích đó.
1. Context bền vững: CLAUDE.md và AGENTS.md
Trước tin nhắn đầu tiên, các agent của bạn cần biết mình đang bước vào đâu: convention, kiến trúc, những điểm đặc biệt của dự án. Tất cả những thứ bạn không muốn giải thích lại mỗi phiên làm việc. Đó là nhiệm vụ của các file context (CLAUDE.md, AGENTS.md), được mọi provider lớn đọc tự động khi khởi động.
Không có context Có CLAUDE.md / AGENTS.md
┌─────────────────────────┐ ┌─────────────────────────┐
│ Bạn giải thích lại │ │ Agent đã biết sẵn: │
│ stack, style, thư mục... │ │ - stack │
│ ở MỖI prompt mới │ │ - convention │
│ │ │ - file nào không đụng │
│ = lãng phí token │ │ │
│ mỗi phiên │ │ = vào thẳng vấn đề │
└─────────────────────────┘ └─────────────────────────┘
Đây là khoản đầu tư giao tiếp có tỷ lệ hoàn vốn cao nhất: viết một lần, thu lợi trên từng prompt. Hướng dẫn CLAUDE.md của chúng tôi hướng dẫn nên đưa gì vào và nên để gì bên ngoài.
2. Thư viện Prompt: đừng bao giờ viết cùng một prompt hai lần
Chắc chắn bạn có những lệnh gõ đi gõ lại: "chạy security review cho diff này", "viết test cho module này theo convention của chúng tôi", "soạn Conventional Commits message". Thư viện Prompt lưu trữ, sắp xếp và đưa chúng trở lại chỉ với hai cú click, vào bất kỳ agent nào.
Chuỗi hóa cũng quan trọng không kém. Với prompt liên kết, bạn chia một tác vụ nặng thành các bước kế tiếp nhau theo thứ tự, thay vì một bức tường khổng lồ mà agent chỉ thực hiện được một nửa.
Một prompt khổng lồ Prompt liên kết (chuỗi)
┌──────────────────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐
│ "Làm A, rồi B, │ │ 1. A │──▶│ 2. B │──▶│ 3. C │
│ rồi C, và đừng │ │ gọn │ │ gọn │ │ gọn │
│ quên D..." │ └─────────┘ └─────────┘ └─────────┘
│ │
│ agent quên │ mỗi bước được kiểm tra
│ phân nửa │ trước khi sang bước tiếp
└──────────────────────┘
3. Thư viện Skill: đóng gói một quy trình, không phải một đoạn văn
Prompt nói cần làm gì. Skill nói làm thế nào ở đây, từng bước một, theo đúng quy tắc của bạn. Thư viện Skill lưu các quy trình có thể tái sử dụng (kiểm tra SEO, migration component, checklist release) và gắn chúng vào agent đúng lúc. Đó là giao tiếp cô đọng: thay vì giải thích lại một quy trình mười bước, bạn gắn skill vào và agent theo đúng protocol.
4. Scratchpad: soạn thảo trước khi gửi
Một prompt tốt được soạn thảo cẩn thận, không phải ngẫu hứng trong lúc nóng vội. Scratchpad là bản nháp luôn trong tầm tay: dán stack trace, một đoạn spec, một ý tưởng, chỉnh sửa lại, cấu trúc hóa, rồi gửi cho agent khi đã sẵn sàng. Ít "ồ khoan, ý tôi là..." hơn, tức là ít vòng lặp hơn.
5. Đọc ý định bằng giọng nói: Voice Dictation và Voice Mode
Nói nhanh gấp ba đến bốn lần so với gõ phím, và thường tự nhiên hơn khi mô tả ý định. AgentsRoom cung cấp hai chế độ:
- Voice dictation chuyển giọng nói của bạn thẳng vào ô soạn thảo. Bạn nói, bạn đọc lại, bạn gửi.
- Voice mode mở cuộc trò chuyện hai chiều thực sự: bạn nói, agent trả lời bằng giọng nói, không cần dùng tay.
Bàn phím ████████████████████████ ~40 từ/phút
Giọng nói ████████████████████████████████████████████████████████████ ~150 từ/phút
Rất hữu ích khi mô tả hành vi mong đợi, suy nghĩ to về kiến trúc, hoặc điều hướng agent trong khi tay bạn đang bận làm việc khác.
6. Cho thấy thay vì mô tả: Sketch và Screenshot to Agent
Có những thứ không thể diễn đạt rõ ràng bằng lời. "Cái nút lệch sang trái quá, khoảng cách phía trên trông kỳ, và modal nên mở ra ở đây": một hình ảnh đáng giá nghìn token.
- Với Sketch, bạn chụp màn hình, chú thích (mũi tên, khung, ghi chú), và gửi hình ảnh đó cho agent làm phản hồi.
- Với Screenshot to Agent, một phím tắt chụp một vùng màn hình và đính kèm thẳng vào prompt.
"Dịch cái đó sang phải [capture có chú thích]
một chút, tôi nghĩ vậy, ┌───────────────┐
bạn hiểu ý tôi chứ..." │ ┌──┐ ←── đây│
│ │ │ │
mơ hồ, bị diễn giải sai │ └──┘ quá thấp│
└───────────────┘
chính xác, không mơ hồ
7. Vòng phản hồi: agent của bạn phản hồi lại bạn
Giao tiếp không chỉ là gửi đi. Mà còn là lắng nghe khi agent cần một quyết định. AgentsRoom đánh dấu agent có tin nhắn mới là chưa đọc, theo phong cách app nhắn tin, và thông báo cho bạn khi agent đang chờ phản hồi, trên desktop và trên mobile. Bạn không còn phải nhìn chằm chằm vào terminal cuộn mãi nữa: agent ping bạn.
BẠN AGENT
│ 1. Context (CLAUDE.md / AGENTS.md) │
│ ────────────────────────────────────────▶ │
│ 2. Ý định (văn bản / giọng nói / sketch) │
│ ────────────────────────────────────────▶ │ thực thi
│ 3. Trạng thái + câu hỏi (badge chưa đọc)│
│ ◀──────────────────────────────────────── │
│ 4. Quyết định / chỉnh sửa │
│ ────────────────────────────────────────▶ │
▼ ▼
ít token hơn ít regression hơn nhanh hơn
Chi tiết tại thông báo và tin nhắn chưa đọc.
8. Đo lường cuộc trò chuyện: theo dõi token
Bạn chỉ tối ưu được những gì bạn đo. Theo dõi lượng token hiển thị, theo từng phiên và từng agent, chi phí của mỗi lần trao đổi. Bạn lập tức thấy loại prompt nào làm hóa đơn tăng vọt và loại nào vẫn gọn nhẹ. Giao tiếp trở thành một khoản mục có thể đo được, không còn là cảm giác mơ hồ nữa.
9. Giao tiếp xuyên provider mà không mất mạch
Claude cho kiến trúc, Codex cho backend, Gemini hay Grok Build cho feature đang phát triển nhanh: chuyển "não" không nên đồng nghĩa với giải thích lại từ đầu. Hỗ trợ đa provider chuyển một agent đang chạy từ provider này sang provider khác và tạo bản tóm tắt bàn giao (file đã chỉnh, hoạt động phiên, tiến độ) để CLI mới tiếp tục từ chỗ CLI trước dừng lại.
Claude ──▶ [bản tóm tắt bàn giao] ──▶ Codex ──▶ [tóm tắt] ──▶ Grok Build
(arch) context giữ nguyên (backend) (feature)
10. Để các agent nói chuyện với nhau
Giao tiếp có lợi nhất đôi khi là giao tiếp bạn không phải tham gia. Ba công cụ xử lý việc đó:
- Teams: agent dev bàn giao cho agent QA, agent QA gửi lại phản hồi, thành một vòng lặp, không cần bạn đứng giữa mỗi lần trao đổi.
- Ủy quyền agent: agent đắt tiền ủy quyền các tác vụ cơ học (chạy test, kiểm tra trên trình duyệt) cho agent dùng model rẻ hơn. Ít token bị tiêu tốn vào việc không cần đến chúng.
- AgentsRoom MCP server: agent của bạn đọc và ghi trong cockpit (backlog, prompt, terminal, trình duyệt), tức là chúng giao tiếp với môi trường của bạn, không chỉ với bạn.
11. Giao tiếp từ bất cứ đâu
Một ý tưởng hay không chờ bạn ngồi vào Mac. Đồng bộ mobile-desktop và điều khiển từ xa cho phép bạn khởi động agent, trả lời câu hỏi hoặc phê duyệt diff từ điện thoại. Vòng lặp giao tiếp không bị gián đoạn khi bạn rời bàn làm việc.
Tóm tắt: kênh nào cho mục đích gì
| Bạn muốn... | Kênh AgentsRoom | Lợi ích chính |
|---|---|---|
| Ngừng giải thích lại dự án | CLAUDE.md / AGENTS.md | Tiết kiệm token mỗi phiên |
| Tái sử dụng lệnh thường dùng | Thư viện Prompt | Tốc độ, nhất quán |
| Chia nhỏ tác vụ lớn | Prompt liên kết | Ít regression hơn |
| Đóng gói một quy trình | Thư viện Skill | Độ chính xác lặp lại |
| Mô tả nhanh và tự nhiên | Giọng nói (dictation / voice mode) | Tốc độ nhập liệu |
| Chỉ ra vấn đề trực quan | Sketch / Screenshot to Agent | Không còn mơ hồ |
| Biết khi nào agent đang chờ | Thông báo / chưa đọc | Ít phải canh chừng |
| Kiểm soát chi phí | Theo dõi token | Tiết kiệm có thể đo được |
| Đổi provider mà không bắt đầu lại | Đa provider | Context được giữ nguyên |
| Giảm tải việc điều phối | Teams / Ủy quyền / MCP | Ít vòng lặp hơn |
| Điều hướng khi di chuyển | Mobile / đồng bộ từ xa | Liên tục không gián đoạn |
Kết luận: giao tiếp là kỹ năng mới
Nghề đã đảo ngược rồi. Viết code vẫn có ích, nhưng đó không còn là nơi trận đấu được quyết định nữa. Điều phân biệt một developer nhanh và tiết kiệm với người tiêu token trong các vòng lặp vô nghĩa là chất lượng giao tiếp của họ với agent: context được thiết lập tốt, ý định rõ ràng, kênh phù hợp cho đúng thông điệp, và vòng phản hồi không tốn của bạn một phút nào.
AgentsRoom được xây dựng xoay quanh ý tưởng đó. Không phải thêm một chat client nữa, mà là một cockpit nơi mỗi công cụ đều tồn tại để giao tiếp tốt hơn, nhanh hơn và rẻ hơn với Claude, Codex, Gemini và Grok Build, song song nhau.
Muốn thử? Tải AgentsRoom, kết nối provider của bạn, và xem chi phí của từng feature giảm xuống khi giao tiếp của bạn sắc bén hơn. Để đi sâu hơn về viết prompt, xem trang prompt engineering cho code của chúng tôi, hoặc khám phá tất cả tính năng.
Tải AgentsRoom
Chạy các agent AI của bạn (Claude, Codex, OpenCode, Gemini CLI, Aider) trên tất cả dự án, trong một cửa sổ duy nhất.
Ứng dụng đồng hành: theo dõi agent khi đi đường
Sử dụng Claude, Codex, Gemini CLI hoặc nhà cung cấp AI khác.
Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.
Một cái nhìn về AgentsRoom đang hoạt động.