Chụp màn hình của bạn,
gửi ảnh chụp thẳng tới AI agent
Screenshot to Agent đặt một nút chụp màn hình ngay trong ô soạn của AI agent và cho bạn một phím tắt tùy chỉnh được để chộp một vùng màn hình từ bất cứ đâu. Nhấn phím tắt hoặc bấm nút, kéo một khung quanh thứ bạn muốn, và ảnh chụp tự đính vào tin nhắn tiếp theo của bạn. Ảnh chụp nằm ngay cạnh câu lệnh và đi thẳng tới AI coding agent của bạn.
Không cần công cụ chụp màn hình bên ngoài, không cần lưu một file PNG ra màn hình desktop, không cần lục tìm file để kéo vào cửa sổ. Bạn bỏ qua toàn bộ màn nhảy múa chụp-lưu-tìm-thả và tiết kiệm vài giây mỗi lần, đó chính là mục đích: giao tiếp giữa bạn và agent gọn gàng hơn, chính xác hơn.
Screenshot to Agent trong thực tế: nhấn phím tắt, kéo một khung quanh vùng màn hình, và ảnh chụp được tự động đính vào tin nhắn gửi tới AI agent của bạn.
Đây là quy trình mà Screenshot to Agent xóa bỏ. Bạn đang vibe coding với một AI agent và có gì đó trên màn hình không ổn: một thẻ lệch hàng, một màu sai, một lỗi console, một bố cục vỡ ở một độ rộng nhất định. Để cho agent thấy, bạn mở một công cụ chụp màn hình riêng, kéo một vùng, lưu một file PNG đâu đó, tìm lại file đó, rồi kéo nó vào ô soạn. Năm bước, một lần chuyển ngữ cảnh, và cuộc trò chuyện với agent bị tạm dừng suốt thời gian ấy.
Screenshot to Agent gói gọn tất cả những việc đó vào một động tác. Bạn nhấn một phím tắt, công cụ chọn vùng của chính hệ điều hành hiện ra, bạn kéo một khung, và ảnh chụp được chụp lại rồi tự động đính vào ô soạn của agent. Không cần mở ứng dụng bên ngoài, không cần lưu file, không cần tìm file, không cần kéo thả. Ảnh chụp nằm ngay cạnh câu lệnh, sẵn sàng để gửi.
Đó là hai lối vào cho cùng một việc. Một nút chụp màn hình trong ô soạn khi tay bạn đã ở trên chuột, và một phím tắt toàn cục tùy chỉnh được khi bạn muốn chụp màn hình từ bất cứ đâu mà không phải bấm qua bấm lại trước. Dù theo cách nào, kết quả cũng như nhau: một ảnh chụp, đính vào tin nhắn của bạn, trên đường tới AI coding agent chỉ trong vài giây.
Hai cách để gửi một ảnh chụp màn hình
Một nút khi tay bạn ở trên chuột, một phím tắt khi tay ở trên bàn phím. Kết quả như nhau.
Nút chụp màn hình trong ô soạn
Mọi ô soạn của agent đều có một nút chụp màn hình. Bấm vào nó và công cụ chọn vùng của hệ điều hành mở ra để bạn kéo một khung quanh bất kỳ phần nào trên màn hình. Ảnh chụp được lưu và đính vào ô soạn của agent đó dưới dạng ảnh thu nhỏ, sẵn sàng gửi. Đây là lối đi hiển nhiên khi bạn đã ở trong ô soạn và đang với tay tới chuột.
Phím tắt tùy chỉnh được
Một phím tắt toàn cục, mặc định là Cmd+Shift+2 trên macOS (Ctrl+Shift+2 trên Windows và Linux), kích hoạt cùng việc chụp vùng đó từ bất cứ đâu, ngay cả khi AgentsRoom không phải là cửa sổ đang được lấy nét. Ảnh chụp được tự động chuyển tới ô soạn của agent đang hoạt động. Phím tắt hoàn toàn tùy chỉnh được: gán lại nó thành tổ hợp bất kỳ bạn thích, hoặc tắt nó, trong phần Cài đặt.

Chụp một vùng màn hình bằng phím tắt hoặc nút trong ô soạn, và ảnh chụp được tự động đính vào tin nhắn gửi tới AI agent của bạn dưới dạng ảnh thu nhỏ, sẵn sàng gửi kèm câu lệnh.
Vì sao Screenshot to Agent thuộc về quy trình làm việc với agent của bạn
Tốc độ. Chụp một vùng màn hình và đưa nó tới agent từng là năm bước qua hai ứng dụng. Giờ chỉ là một phím tắt và một cú kéo. Bạn tiết kiệm vài giây mỗi lần chụp, và khi bạn chụp gửi agent hàng chục lần mỗi ngày, những giây đó dồn lại thành mạch làm việc thực sự.
Độ chính xác. Một ảnh chụp cho agent thấy chính xác những gì bạn thấy, từng pixel một, thay vì một đoạn văn cố mô tả nó. Phần đệm sai, căn lề vỡ, lỗi ở góc màn hình: agent nhận được hình ảnh thật, chứ không phải nỗ lực kể lại tốt nhất của bạn.
Không cần công cụ bên ngoài. Bạn không mở một ứng dụng chụp màn hình riêng, không rải đầy file PNG ra màn hình desktop, không lục Finder để tìm cái vừa chụp. Việc chụp và việc đính diễn ra trong một thao tác duy nhất, bên trong AgentsRoom.
Mạch làm việc. Phím tắt chạy từ bất cứ đâu và ảnh chụp quay về ô soạn ngay cạnh câu lệnh. Bạn không bao giờ rời terminal, không bao giờ làm gián đoạn cuộc trò chuyện với agent, và ảnh chụp cùng các hướng dẫn bằng văn bản của bạn đi cùng nhau trong cùng một tin nhắn.
Screenshot to Agent hoạt động từ đầu đến cuối ra sao
Từ một phím tắt đến một ảnh chụp đính vào tin nhắn của agent.
Khởi động việc chụp
Nhấn phím tắt (mặc định Cmd+Shift+2) từ bất cứ đâu, hoặc bấm nút chụp màn hình bên trong ô soạn của agent. Cả hai đều bắt đầu cùng một thao tác chụp vùng y hệt.
Kéo một khung quanh vùng cần chụp
Công cụ chọn vùng của chính hệ điều hành tiếp quản: một con trỏ chữ thập trên macOS qua screencapture, lớp phủ Snip trên Windows, grim, spectacle hay gnome-screenshot trên Linux. Kéo một khung quanh phần màn hình bạn muốn. Đó là giao diện chụp mà bạn đã quen.
Ảnh chụp tự đính vào
Vùng đã chụp được lưu thành một file PNG và thả thẳng vào ô soạn của agent đang được lấy nét dưới dạng ảnh thu nhỏ, hệt như một file bạn kéo vào. Không cần lưu ra màn hình desktop, không cần tìm file, không cần kéo thả. Nó đã ở đó rồi.
Viết câu lệnh xoay quanh nó
Gõ tin nhắn của bạn như thường lệ. Nhắc tới ảnh chụp bằng lời nếu bạn muốn, hoặc cứ để ảnh chụp đính kèm tự nói lên tất cả. Ảnh chụp hiện ra như một file được đánh số trong ô soạn, nên bạn có thể chỉ rõ cho agent vào đúng nó.
Gửi nó tới agent
Bấm gửi. File PNG đi ra cùng tin nhắn của bạn qua cùng một đường ống như mọi tệp đính kèm khác. Ảnh chụp và các hướng dẫn bằng văn bản của bạn tới agent cùng nhau, trong một lượt duy nhất.
Agent đọc màn hình của bạn
AI coding agent của bạn nhận ảnh chụp dưới dạng một hình ảnh đính kèm. Miễn là mô hình của nó chấp nhận đầu vào hình ảnh, nó nhìn thấy đúng những gì có trên màn hình của bạn và hành động dựa trên đó, thay vì phân tích một đoạn văn cố mô tả một vấn đề trực quan.
Screenshot to Agent thực chất là gì
Screenshot to Agent là một luồng chụp vùng được nối thẳng vào ứng dụng desktop AgentsRoom. Nó không phải một trình xem ảnh chụp gắn thêm ở bên cạnh. Nó móc vào công cụ chọn vùng gốc của hệ điều hành của bạn, vẫn con trỏ chữ thập screencapture trên macOS, vẫn lớp phủ Snip trên Windows, vẫn các công cụ grim, spectacle, gnome-screenshot, maim, scrot hay flameshot trên Linux, nên trải nghiệm chụp chính là cái bạn đã dùng, không có gì mới phải học.
Hai cách kích hoạt, nút trong ô soạn và phím tắt toàn cục, đều chạy cùng một việc chụp và đều kết thúc theo cùng một cách: ảnh chụp được đính vào ô soạn của agent đang được lấy nét. Phím tắt là toàn cục, nên nó kích hoạt ngay cả khi AgentsRoom ở dưới nền, và nó hoàn toàn tùy chỉnh được. Bạn gán lại hoặc tắt nó trong phần cài đặt ô soạn, nơi một trình ghi phím tắt cho bạn nhấn đúng tổ hợp mình muốn.
Sau khi chụp, file PNG được lưu cục bộ và thêm vào khay tệp của ô soạn dưới dạng ảnh thu nhỏ, nơi nó nhận một số tham chiếu như mọi file được thả vào. Từ đó nó đi theo đường thông thường: nó đi ra cùng câu lệnh của bạn và được gửi tới agent dưới dạng một hình ảnh. Screenshot to Agent không phát minh ra một cơ chế gửi mới, nó cắm vào cơ chế vốn đã chuyển file tới agent của bạn.
Mọi thứ ở lại trên máy của bạn. Các ảnh chụp được lưu vào một thư mục cục bộ trong thư mục home của bạn, không nằm trong repo dự án và không trên bất kỳ dịch vụ bên thứ ba nào, và chúng được dọn dẹp tự động nên không bao giờ chất đống. Screenshot to Agent là cục bộ, riêng tư và không phụ thuộc nhà cung cấp: nó đính một file PNG thuần, nên bất kỳ agent nào có mô hình chấp nhận hình ảnh đều đọc được, nghĩa là các thiết lập Claude Code và Codex đều có cùng luồng chụp-tới-agent. Đây là một tính năng desktop, có trên macOS, Windows và Linux.
Người ta chụp gì để gửi tới agent
Ba khoảnh khắc mà một ảnh chụp thắng cả một đoạn văn mô tả.
Cho thấy một lỗi trực quan hoặc lỗi giao diện
Chụp giao diện bị vỡ, phần tử lệch hàng, khoảng cách sai, lỗi console, và gửi đi. Agent nhìn thấy lỗi thật thay vì phải giải mã mô tả của bạn về nó. Cách nhanh nhất để báo một lỗi giao diện hồi quy cho một AI coding agent.
Chỉ vào thứ đang ở trên màn hình
Một biểu đồ, một đầu ra terminal, một diff, một bảng điều khiển bên thứ ba, bất cứ thứ gì hiện trên màn hình của bạn. Chụp vùng đó và trao cho agent làm ngữ cảnh thay vì gõ lại những gì nó hiển thị. Ảnh chụp mang theo chi tiết mà lời nói của bạn sẽ bỏ sót.
Chuyển một tham chiếu trực quan
Một thiết kế bạn đang bám theo, một bố cục bạn thích, một thành phần từ một ứng dụng khác. Chụp lại tham chiếu đó và đưa cho agent làm mục tiêu, rồi để nó dựng theo đúng những gì bạn đã chụp.
Mô tả nó, hay cứ chụp nó lại
Cùng một màn hình, cùng một agent. Một lối đi là việc vặt năm bước, lối kia chỉ là một phím tắt.
Không có Screenshot to Agent
- : Bạn mở một công cụ chụp màn hình riêng, kéo một vùng, và lưu một file PNG đâu đó.
- : Bạn lục tìm file đó, rồi kéo thả nó vào ô soạn.
- : Hoặc bạn bỏ cuộc và cố mô tả vấn đề trực quan bằng lời.
- : Việc chuyển ngữ cảnh làm đứt mạch và tạm dừng cuộc trò chuyện với agent.
- : Mỗi lần chụp lại tốn của bạn chừng ấy giây, suốt cả ngày.
Có Screenshot to Agent
- : Bạn nhấn phím tắt hoặc bấm nút và kéo một khung. Một động tác.
- : Ảnh chụp tự đính vào ô soạn một cách tự động.
- : Không cần ứng dụng bên ngoài, không cần file đã lưu, không cần tìm nó, không cần kéo thả.
- : Bạn không bao giờ rời AgentsRoom và không bao giờ làm đứt mạch với agent.
- : Ảnh chụp và câu lệnh của bạn tới agent cùng nhau, trong một lượt.
Screenshot to Agent là con đường ngắn nhất giữa những gì trên màn hình của bạn và một AI agent có thể nhìn thấy nó.
FAQ
Screenshot to Agent trong AgentsRoom là gì?
Screenshot to Agent là cách tích hợp sẵn để chụp một vùng màn hình và gửi thẳng tới AI coding agent của bạn. Bạn kích hoạt nó từ một nút chụp màn hình trong ô soạn của agent hoặc từ một phím tắt toàn cục tùy chỉnh được, kéo một khung bằng công cụ chọn vùng của hệ điều hành, và ảnh chụp được tự động đính vào tin nhắn tiếp theo của bạn. Không cần công cụ chụp màn hình bên ngoài và không cần di chuyển file.
Làm sao để gửi một ảnh chụp màn hình tới một AI agent?
Nhấn phím tắt (mặc định Cmd+Shift+2, Ctrl+Shift+2 trên Windows và Linux) hoặc bấm nút chụp màn hình trong ô soạn, rồi kéo một khung quanh phần màn hình bạn muốn. Ảnh chụp được chụp lại và đính vào ô soạn của agent dưới dạng ảnh thu nhỏ. Viết câu lệnh của bạn rồi gửi: ảnh chụp tới agent cùng với phần văn bản của bạn.
Phím tắt mặc định là gì, và tôi có đổi được không?
Mặc định là Cmd+Shift+2 trên macOS và Ctrl+Shift+2 trên Windows và Linux. Đó là một phím tắt toàn cục, nên nó kích hoạt ngay cả khi AgentsRoom không phải là cửa sổ đang được lấy nét. Bạn có thể gán lại nó thành bất kỳ tổ hợp nào bạn thích, hoặc tắt hẳn nó, trong phần cài đặt ô soạn, nơi một trình ghi phím tắt cho bạn nhấn đúng các phím mình muốn.
Nó có hoạt động khi AgentsRoom ở dưới nền không?
Có. Phím tắt được đăng ký ở mức toàn cục, nên bạn có thể chụp một vùng màn hình từ bất kỳ ứng dụng nào và ảnh chụp được chuyển tới ô soạn của agent AgentsRoom đang hoạt động. Bạn không phải đưa cửa sổ lên trước.
Tôi có cần một công cụ chụp màn hình bên ngoài không?
Không, đó chính là điểm cốt lõi. Screenshot to Agent dùng chính công cụ chọn vùng của hệ điều hành của bạn (screencapture trên macOS, lớp phủ Snip trên Windows, grim, spectacle hay gnome-screenshot trên Linux) và đính kết quả giúp bạn. Bạn không mở một ứng dụng chụp màn hình riêng, không lưu một file PNG ra màn hình desktop, và không kéo một file vào cửa sổ.
Ảnh chụp của tôi được lưu ở đâu? Chúng có riêng tư không?
Các ảnh chụp được lưu vào một thư mục cục bộ trong thư mục home trên chính máy của bạn. Chúng không được commit vào repo dự án và không được tải lên bất kỳ dịch vụ bên thứ ba nào. Theo thiết kế, chúng chỉ là tạm thời và được dọn dẹp tự động, nên chúng không chất đống theo thời gian.
Những agent và nhà cung cấp nào hoạt động với Screenshot to Agent?
Nó đính một hình ảnh PNG tiêu chuẩn, nên nó không phụ thuộc nhà cung cấp. Bất kỳ agent nào có mô hình chấp nhận đầu vào hình ảnh đều hoạt động: Claude Code, Codex và các CLI khác mà AgentsRoom hỗ trợ. Không có cấu hình riêng cho từng nhà cung cấp phải làm.
Tôi có thể chỉ chụp một phần màn hình không?
Có. Công cụ chọn vùng cho bạn kéo một khung quanh đúng phần màn hình bạn muốn, nên bạn chỉ gửi vùng liên quan thay vì một ảnh chụp toàn màn hình. Bạn cắt ngay lúc chụp, bằng giao diện chọn vùng gốc mà bạn đã quen.
Tôi có thể chú thích lên ảnh chụp trước khi gửi không?
Screenshot to Agent đính ảnh chụp thô. Nếu bạn muốn khoanh tròn một lỗi, vẽ một mũi tên hay làm nổi một vùng lên trên nó, hãy mở ảnh chụp trong Sketch, khung vẽ trong ô soạn, chú thích lên đó, và bản đã đánh dấu sẽ tới agent. Chụp bằng Screenshot to Agent, đánh dấu bằng Sketch.
Vì sao nên chụp vấn đề thay vì mô tả nó?
Vì mô tả là một phỏng đoán còn ảnh chụp thì không. Khi bạn viết 'nút ở góc trên bên phải bị lệch', agent phải dựng lại màn hình của bạn trong đầu nó. Khi bạn gửi ảnh chụp thật, không còn gì phải dựng lại. Một ảnh chụp mang theo chi tiết trực quan thật, nên agent hành động dựa trên những gì bạn thấy thay vì dựa trên nỗ lực kể lại tốt nhất của bạn.
Kết hợp tốt với
Sketch
Một khung vẽ trong ô soạn. Chụp màn hình bằng Screenshot to Agent, rồi mở nó trong Sketch để khoanh tròn lỗi, vẽ một mũi tên hoặc làm nổi một vùng trước khi gửi.
Voice Dictation
Đọc câu lệnh của bạn thay vì gõ. Ghép một hướng dẫn bằng lời với ảnh chụp bạn vừa chụp và agent nhận cả hai cùng một lúc.
Prompt Library
Lưu và tái dùng những câu lệnh hay nhất của bạn. Bắn một câu lệnh đã lưu kèm một ảnh chụp mới và bỏ qua hẳn việc gõ.
Scratchpad
Một sổ tay cho câu lệnh và ghi chú trong AgentsRoom. Soạn lời, đính ảnh chụp, gửi toàn bộ ngữ cảnh tới ô soạn của agent.
Ngừng lưu file PNG. Cứ chụp nó là xong.
Tải AgentsRoom và dùng Screenshot to Agent: một nút chụp màn hình và một phím tắt tùy chỉnh được giúp chụp một vùng màn hình và gửi thẳng tới AI coding agent của bạn, không cần công cụ chụp màn hình bên ngoài và không cần di chuyển file.
Ứng dụng đồng hành: theo dõi agent khi đi đường
Sử dụng Claude, Codex, Gemini CLI hoặc nhà cung cấp AI khác.
Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.
Một cái nhìn về AgentsRoom đang hoạt động.