Mẹo chim hoàng yến: bắt lỗi Claude (hay bất kỳ tác nhân AI nào) trước khi nó bắt đầu ảo giác

Một mẹo chỉ một dòng để biết khi nào tác nhân lập trình AI của bạn bắt đầu xuống cấp: bắt nó mở đầu mỗi câu trả lời bằng một cái tên. Khi cái tên biến mất, chim hoàng yến đã chết và đến lúc mở phiên mới. Hoạt động với Claude, Codex, Gemini CLI, Mistral Vibe và mọi LLM.

Một phiên dài với tác nhân lập trình AI hiếm khi sụp đổ trong một lần. Claude không nhảy từ sắc bén sang vô nghĩa chỉ trong một lượt. Trước tiên nó lặng lẽ bỏ qua một chỉ dẫn nhỏ. Một hai lượt sau, nó bắt đầu bịa: một tệp không tồn tại, một API chưa từng có, một quyết định mà bạn đã loại bỏ rõ ràng. Đến khi bạn phát hiện một đường dẫn ảo giác, bạn đã mất niềm tin vào vài câu trả lời gần nhất và đang gỡ lỗi cho tác nhân thay vì mã của mình.

Có một cách miễn phí, đơn giản đến gần như ngượng ngùng, để có được cảnh báo sớm. Nó tên là chim hoàng yến, và chỉ cần một dòng để thiết lập.

Vì sao các tác nhân chệch hướng: mục ngữ cảnh (context rot)

Mỗi lượt, tác nhân đọc lại toàn bộ cuộc trò chuyện, từ tin nhắn đầu đến tin nhắn cuối, và dựng lại hiểu biết của nó từ con số không. Khi cửa sổ ngữ cảnh đầy dần, thứ đầu tiên lung lay chính là việc tuân theo chỉ dẫn. Mô hình vẫn nghe có vẻ tự tin, nhưng đã bắt đầu buông những ràng buộc kém quan trọng nhất để theo kịp. Các nhà nghiên cứu gọi đây là «context rot», cùng với hiệu ứng liên quan «lost in the middle»: ngữ cảnh càng dài, mô hình càng kém tin cậy trong việc tôn trọng một chỉ dẫn đơn lẻ bị chôn vùi bên trong.

Đó là cái nhìn cốt lõi. Sự xuống cấp không bắt đầu bằng ảo giác. Nó bắt đầu bằng việc mô hình lặng lẽ phớt lờ một chỉ dẫn nhỏ. Vậy nên nếu bạn gieo một chỉ dẫn tí hon mà nhiệm vụ duy nhất là được chú ý khi nó biến mất, bạn có một dây bẫy bật lên trước khi thiệt hại thật xảy ra.

Mẹo chim hoàng yến là gì

Thợ mỏ xưa kia mang theo một con chim hoàng yến xuống hầm. Con chim nhạy với khí độc hơn con người: khi nó ngừng hót, thợ mỏ biết phải thoát ra, rất lâu trước khi chính họ cảm thấy điều gì.

Chim hoàng yến trong prompt cũng là ý tưởng đó. Bạn thêm một chỉ dẫn tầm thường vào tệp mà tác nhân đọc mỗi lượt: mở đầu mỗi câu trả lời bằng một cái tên đã chọn. Cái tên đó là con chim hoàng yến của bạn. Chừng nào nó còn hiện ở đầu mỗi câu trả lời, mô hình vẫn đang đọc và tôn trọng chỉ dẫn của bạn. Câu trả lời đầu tiên quên cái tên chính là tín hiệu rằng phiên đang xuống cấp, thường là một hai lượt trước khi ảo giác thật xuất hiện. Kỹ thuật này được phổ biến trong cộng đồng lập trình bằng tác nhân bởi những lập trình viên như Peter Steinberger, người tạo ra OpenClaw, vốn dựa vào những tín hiệu hoàng yến nhỏ để sớm bắt được một phiên đang trở xấu.

Đường cong cho thấy độ tin cậy trong việc tuân theo chỉ dẫn của một tác nhân AI tụt xuống trong suốt một phiên dài: chỉ dẫn hoàng yến biến mất trước khi ảo giác bắt đầu, để lại một cửa sổ cảnh báo sớm.

Chim hoàng yến biến mất trước khi ảo giác bắt đầu. Khoảng trống đó chính là cửa sổ để bạn phản ứng.

Thiết lập trong một dòng

Đặt chỉ dẫn vào tệp mà tác nhân của bạn nạp mỗi lượt:

  • Claude Code đọc CLAUDE.md.
  • Codex, Gemini CLI, Mistral Vibe và hầu hết các CLI khác đọc AGENTS.md.
## Chim hoàng yến
Mở đầu mỗi câu trả lời bằng cái tên "Felix".

Hãy chọn một cái tên ngắn, dễ nhận ra: con mèo của bạn, một màu sắc, bất cứ thứ gì bạn nhận ra ngay ở đầu câu trả lời. Giữ nó đơn giản hết mức. Một chỉ dẫn phức tạp đi ngược lại mục đích, bởi bạn muốn thứ dễ buông nhất đối với mô hình. Nếu đến cái này cũng rớt, thì mọi thứ tinh tế hơn trong ngữ cảnh của bạn đã lâm nguy rồi.

Làm gì khi chim hoàng yến chết

Cái tên chưa bao giờ là điểm mấu chốt. Điểm mấu chốt là thời điểm. Khi chim hoàng yến biến mất, đừng cố đẩy tiếp luồng hiện tại:

  1. Ngừng tin vào hai ba câu trả lời gần nhất và đọc lại chúng với sự nghi ngờ.
  2. Chạy /clear hoặc bắt đầu một phiên mới.
  3. Chỉ tiêm lại ngữ cảnh thực sự quan trọng: tệp bạn đang chỉnh sửa, mục tiêu, và những quyết định đã đưa ra.

Một cửa sổ sạch với bản tóm tắt gọn gàng luôn thắng một cửa sổ phình to. Bạn không mất tiến độ, bạn vứt đi gánh nặng đã kéo mô hình đi xuống.

Vòng lặp quyết định: đọc câu trả lời của tác nhân, kiểm tra xem nó có mở đầu bằng cái tên không. Nếu có, chim hoàng yến còn sống, hãy tiếp tục làm việc. Nếu không, chim hoàng yến đã chết, vậy hãy xóa ngữ cảnh hoặc bắt đầu phiên mới và tiêm lại ngữ cảnh cốt lõi.

Cả thói quen gói gọn trong một vòng lặp: liếc qua từ đầu tiên, quyết định, tiếp tục hay đặt lại.

Nó hoạt động trên mọi mô hình, không chỉ Claude

Mẹo này về bản chất thiết kế là không phụ thuộc nhà cung cấp. Claude, Codex, Gemini CLI, Mistral Vibe, Grok và Aider đều chia sẻ cùng giới hạn ngữ cảnh, đều đọc một tệp ngữ cảnh, và đều có thể mang một con chim hoàng yến. Chúng tôi tập trung vào Claude trước vì đó là tác nhân lập trình được dùng nhiều nhất hiện nay, nhưng không có gì ở đây là riêng của Claude. Bất kỳ LLM nào lấp đầy ngữ cảnh của nó cũng sẽ bắt đầu bằng việc buông chỉ dẫn nhỏ nhất của bạn, nên cùng một con chim hoàng yến bảo vệ từng cái một. Nếu bạn duy trì một tệp ngữ cảnh AGENTS.md, chim hoàng yến chỉ là thêm một dòng trong đó.

Trông chừng chim hoàng yến trên cả một đội

Đọc từng câu trả lời để tìm cái tên bị thiếu thì dễ với một tác nhân. Nó không mở rộng được khi bạn chạy nhiều tác nhân cùng lúc, mà đó chính là nơi phần lớn công việc nghiêm túc diễn ra ngày nay.

Đó là phần mà AgentsRoom làm cho dễ. Đây là một buồng lái đa tác nhân: mỗi tác nhân có một vai trò, một chấm trạng thái trực tiếp và màu riêng, và bạn giám sát cả đội từ một cửa sổ. Đặt chim hoàng yến một lần vào CLAUDE.md hoặc AGENTS.md dùng chung, và mọi tác nhân đều thừa hưởng nó. Khi một tác nhân bắt đầu rớt cái tên, bạn bắt được chỉ trong một cái liếc và đặt lại đúng luồng đó thay vì cả dự án. Tùy chọn cô lập bằng git worktree giúp các tác nhân song song không giẫm chân nhau trong lúc bạn làm việc đó.

Bảy nhà cung cấp, một buồng lái, và một con chim hoàng yến canh chừng từng cái. Tải AgentsRoom, xem ma trận tương thích nhà cung cấp để biết mỗi tác nhân hỗ trợ gì, và đọc thêm về hỗ trợ đa nhà cung cấp cùng cách việc chuyển đổi giữa cuộc trò chuyện giữ nguyên vẹn ngữ cảnh của bạn.

Tải AgentsRoom

Chạy các agent AI của bạn (Claude, Codex, OpenCode, Gemini CLI, Aider) trên tất cả dự án, trong một cửa sổ duy nhất.

Miễn phíTải AgentsRoom

Ứng dụng đồng hành: theo dõi agent khi đi đường

Sử dụng Claude, Codex, Gemini CLI hoặc nhà cung cấp AI khác.

Tải tiện ích mở rộng
Chrome Web Store

Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.

Một cái nhìn về AgentsRoom đang hoạt động.

Nhiều dự án
Đa nhà cung cấp
Nhiều agent
Trạng thái trực tiếp
File diff & commit
Ứng dụng đồng hành mobile
Xem trước trực tiếp
Đội agent
Tự động hóa trình duyệt
Dev theo backlog
Thư viện prompt
Thư viện skill
Xem tất cả tính năng