Captura tu pantalla,
envía la captura directa a tu agente IA
Screenshot to Agent coloca un botón de captura justo en el composer del agente IA y te da un atajo de teclado configurable para capturar una zona de la pantalla desde cualquier sitio. Pulsa el atajo o haz clic en el botón, dibuja un recuadro alrededor de lo que quieras y la captura se adjunta sola a tu siguiente mensaje. La captura aterriza junto a tu prompt y llega directa a tu agente IA de código.
Sin herramienta de captura externa, sin guardar un PNG en el escritorio, sin buscar el archivo para arrastrarlo a la ventana. Te ahorras todo el baile de capturar, guardar, localizar y soltar, y ganas unos segundos cada vez, que es justo el objetivo: una comunicación más ajustada y de mayor fidelidad entre tú y tu agente.
Screenshot to Agent en acción: pulsa el atajo de teclado, dibuja un recuadro alrededor de la zona de la pantalla y la captura se adjunta sola al mensaje de tu agente IA.
Este es el flujo que Screenshot to Agent elimina. Estás haciendo vibe coding con un agente IA y algo en pantalla no cuadra: una tarjeta mal alineada, un color erróneo, un error de consola, un layout que se rompe a cierto ancho. Para enseñárselo al agente, recurres a una herramienta de capturas aparte, dibujas una zona, guardas un PNG en algún sitio, buscas ese archivo y lo arrastras al composer. Cinco pasos, un cambio de contexto, y la conversación con tu agente queda en pausa todo ese rato.
Screenshot to Agent reduce todo eso a un solo gesto. Pulsas un atajo de teclado, aparece el selector de región de tu propio sistema operativo, dibujas un recuadro y la captura queda hecha y adjuntada al composer del agente automáticamente. Sin app externa que abrir, sin archivo que guardar, sin archivo que localizar, sin arrastrar y soltar. La captura está junto a tu prompt, lista para enviar.
Son dos puntos de entrada para lo mismo. Un botón de captura en el composer cuando ya tienes la mano en el ratón, y un atajo global personalizable cuando quieres capturar la pantalla desde cualquier sitio sin tener que hacer clic primero. En ambos casos el resultado es idéntico: una captura, adjunta a tu mensaje, de camino a tu agente IA de código en segundos.
Dos formas de enviar una captura
Un botón cuando tienes la mano en el ratón, un atajo cuando la tienes en el teclado. El mismo resultado.
El botón de captura en el composer
Cada composer de agente tiene un botón de captura. Haz clic y se abre el selector de región de tu sistema operativo para que dibujes un recuadro alrededor de cualquier parte de tu pantalla. La captura se guarda y se adjunta al composer de ese agente como miniatura, lista para enviar. Es el camino evidente cuando ya estás en el composer y la mano va al ratón.
El atajo de teclado configurable
Un atajo de teclado global, Cmd+Shift+2 por defecto en macOS (Ctrl+Shift+2 en Windows y Linux), dispara la misma captura de región desde cualquier sitio, incluso cuando AgentsRoom no es la ventana activa. La captura se enruta al composer de tu agente activo automáticamente. El atajo es totalmente personalizable: reasígnalo a la combinación que quieras, o desactívalo, en Ajustes.

Captura una zona de la pantalla con el atajo o el botón del composer, y la captura se adjunta sola al mensaje de tu agente IA como miniatura, lista para enviar con tu prompt.
Por qué Screenshot to Agent encaja en tu flujo con agentes
Velocidad. Capturar una zona de la pantalla y ponerla delante de tu agente eran cinco pasos repartidos en dos apps. Ahora es un atajo y un arrastre. Te ahorras unos segundos en cada captura, y cuando capturas para el agente decenas de veces al día, esos segundos se convierten en flow de verdad.
Precisión. Una captura le muestra al agente exactamente lo que ves, píxel a píxel, en lugar de un párrafo intentando describirlo. El padding mal puesto, la alineación rota, el error en la esquina: el agente recibe la imagen real, no tu mejor intento de narrarla.
Sin herramienta externa. No abres una app de capturas aparte, no llenas el escritorio de archivos PNG, no rebuscas en el Finder para encontrar la que acabas de hacer. La captura y el adjunto ocurren en una sola acción, dentro de AgentsRoom.
Flow. El atajo funciona desde cualquier sitio y la captura vuelve al composer junto a tu prompt. Nunca sales del terminal, nunca rompes la conversación con el agente, y tu captura y tus instrucciones escritas viajan juntas en el mismo mensaje.
Cómo funciona Screenshot to Agent, de principio a fin
De un atajo de teclado a una captura adjunta al mensaje de tu agente.
Dispara la captura
Pulsa el atajo de teclado (Cmd+Shift+2 por defecto) desde cualquier sitio, o haz clic en el botón de captura dentro del composer del agente. Ambos inician exactamente la misma captura de región.
Dibuja un recuadro alrededor de la zona
El propio selector de región de tu sistema operativo toma el control: una cruz en macOS vía screencapture, el overlay de Snip en Windows, grim, spectacle o gnome-screenshot en Linux. Dibuja un recuadro alrededor de la parte de la pantalla que quieras. Es la interfaz de captura que ya conoces.
La captura se adjunta sola
La zona capturada se guarda como PNG y se deja directamente en el composer del agente activo como miniatura, igual que un archivo que arrastraste. Sin guardar en el escritorio, sin localizar el archivo, sin arrastrar y soltar. Ya está ahí.
Escribe tu prompt alrededor
Escribe tu mensaje como siempre. Haz referencia a la captura con tus palabras si quieres, o deja que la captura adjunta hable por sí misma. La captura aparece como un archivo numerado en el composer, así que puedes señalársela al agente de forma explícita.
Envíasela al agente
Pulsa enviar. El PNG sale con tu mensaje por el mismo canal que cualquier otro adjunto. Tu captura y tus instrucciones escritas llegan al agente juntas, en un solo turno.
El agente lee tu pantalla
Tu agente IA de código recibe la captura como imagen adjunta. Mientras su modelo acepte entrada de imágenes, ve exactamente lo que había en tu pantalla y actúa en consecuencia, en lugar de interpretar un párrafo que intenta describir un problema visual.
Qué es Screenshot to Agent en realidad
Screenshot to Agent es un flujo de captura de región conectado directamente a la app de escritorio de AgentsRoom. No es un visor de capturas pegado al lado. Se engancha al selector de región nativo de tu sistema operativo, la misma cruz de screencapture en macOS, el mismo overlay de Snip en Windows, las mismas herramientas grim, spectacle, gnome-screenshot, maim, scrot o flameshot en Linux, así que la experiencia de captura es la que ya usas, sin nada nuevo que aprender.
Los dos disparadores, el botón del composer y el atajo de teclado global, ejecutan la misma captura y terminan igual: la captura se adjunta al composer del agente activo. El atajo es global, así que se dispara incluso cuando AgentsRoom está en segundo plano, y es totalmente configurable. Lo reasignas o lo desactivas desde los ajustes del composer, donde un grabador de atajos te deja pulsar la combinación exacta que quieras.
Una vez capturado, el PNG se guarda en local y se añade a la bandeja de archivos del composer como miniatura, donde recibe un número de referencia como cualquier archivo soltado. A partir de ahí sigue el camino normal: sale con tu prompt y se envía al agente como imagen. Screenshot to Agent no inventa un mecanismo de envío nuevo, se conecta al que ya mueve archivos a tu agente.
Todo se queda en tu máquina. Las capturas se guardan en una carpeta local de tu directorio personal, no dentro del repositorio de tu proyecto ni en ningún servicio de terceros, y se limpian automáticamente para que nunca se acumulen. Screenshot to Agent es local, privado y agnóstico de proveedor: adjunta un PNG normal, así que cualquier agente cuyo modelo acepte una imagen puede leerlo, lo que significa que las configuraciones de Claude Code y Codex obtienen el mismo flujo de captura a agente. Es una funcionalidad de escritorio, disponible en macOS, Windows y Linux.
Qué captura la gente para su agente
Tres momentos en los que una captura gana a un párrafo de descripción.
Muestra un bug visual o de UI
Captura la interfaz rota, el elemento desalineado, el espaciado erróneo, el error de consola, y envíalo. El agente ve el bug real en lugar de descifrar tu descripción de él. La forma más rápida de reportar una regresión de UI a un agente IA de código.
Señala lo que hay en pantalla
Un gráfico, una salida de terminal, un diff, un dashboard de terceros, cualquier cosa visible en tu pantalla. Captura la zona y dásela al agente como contexto en lugar de reescribir lo que dice. La captura lleva el detalle que tus palabras dejarían fuera.
Pasa una referencia visual
Un diseño que estás replicando, un layout que te gusta, un componente de otra app. Haz una captura de la referencia y dásela al agente como objetivo, luego deja que construya hacia lo que capturaste.
Descríbelo, o simplemente captúralo
La misma pantalla, el mismo agente. Un camino es una tarea de cinco pasos, el otro es un atajo.
Sin Screenshot to Agent
- : Abres una herramienta de captura aparte, dibujas una zona y guardas un PNG en algún sitio.
- : Buscas ese archivo y luego lo arrastras y sueltas en el composer.
- : O te rindes e intentas describir el problema visual con palabras.
- : El cambio de contexto rompe tu flow y pausa la conversación con el agente.
- : Cada captura te cuesta los mismos segundos, durante todo el día.
Con Screenshot to Agent
- : Pulsas el atajo o haces clic en el botón y dibujas un recuadro. Un solo gesto.
- : La captura se adjunta sola al composer automáticamente.
- : Sin app externa, sin archivo guardado, sin localizarlo, sin arrastrar y soltar.
- : Nunca sales de AgentsRoom y nunca rompes el hilo con el agente.
- : La captura y tu prompt llegan al agente juntos, en un solo turno.
Screenshot to Agent es el camino más corto entre lo que hay en tu pantalla y un agente IA que puede verlo.
FAQ
¿Qué es Screenshot to Agent en AgentsRoom?
Screenshot to Agent es una forma integrada de capturar una zona de tu pantalla y enviarla directa a tu agente IA de código. Lo disparas desde un botón de captura en el composer del agente o desde un atajo de teclado global configurable, dibujas un recuadro con el selector de región de tu sistema operativo y la captura se adjunta sola a tu siguiente mensaje. Sin herramienta de captura externa y sin mover archivos.
¿Cómo envío una captura a un agente IA?
Pulsa el atajo de teclado (Cmd+Shift+2 por defecto, Ctrl+Shift+2 en Windows y Linux) o haz clic en el botón de captura del composer, luego dibuja un recuadro alrededor de la parte de tu pantalla que quieras. La captura queda hecha y adjuntada al composer del agente como miniatura. Escribe tu prompt y envía: la captura llega al agente junto con tu texto.
¿Cuál es el atajo de teclado por defecto, y puedo cambiarlo?
El predeterminado es Cmd+Shift+2 en macOS y Ctrl+Shift+2 en Windows y Linux. Es un atajo global, así que se dispara incluso cuando AgentsRoom no es la ventana activa. Puedes reasignarlo a cualquier combinación que quieras, o desactivarlo del todo, en los ajustes del composer, donde un grabador de atajos te deja pulsar las teclas exactas que quieras.
¿Funciona cuando AgentsRoom está en segundo plano?
Sí. El atajo de teclado está registrado globalmente, así que puedes capturar una zona de la pantalla desde cualquier app y la captura se enruta al composer de tu agente activo en AgentsRoom. No tienes que traer la ventana al frente primero.
¿Necesito una herramienta de captura externa?
No, ese es justo el objetivo. Screenshot to Agent usa el propio selector de región de tu sistema operativo (screencapture en macOS, el overlay de Snip en Windows, grim, spectacle o gnome-screenshot en Linux) y adjunta el resultado por ti. No abres una app de capturas aparte, no guardas un PNG en el escritorio y no arrastras un archivo a la ventana.
¿Dónde se guardan mis capturas? ¿Son privadas?
Las capturas se guardan en una carpeta local de tu directorio personal, en tu propia máquina. No se commitean al repositorio de tu proyecto ni se suben a ningún servicio de terceros. Son transitorias por diseño y se limpian automáticamente, así que no se acumulan con el tiempo.
¿Qué agentes y proveedores funcionan con Screenshot to Agent?
Adjunta una imagen PNG estándar, así que es agnóstico de proveedor. Cualquier agente cuyo modelo acepte entrada de imágenes funciona: Claude Code, Codex y los demás CLI que AgentsRoom soporta. No hay configuración específica por proveedor que hacer.
¿Puedo capturar solo una parte de la pantalla?
Sí. El selector de región te deja dibujar un recuadro alrededor de exactamente la parte de la pantalla que quieras, así que envías solo el área relevante en lugar de una captura de pantalla completa. Recortas en el momento de capturar, con la interfaz de selección nativa que ya conoces.
¿Puedo anotar la captura antes de enviarla?
Screenshot to Agent adjunta la captura en bruto. Si quieres rodear un bug, dibujar una flecha o resaltar una zona encima, abre la captura en Sketch, el lienzo de dibujo del composer, anótala, y la versión marcada va al agente. Captura con Screenshot to Agent, márcala con Sketch.
¿Por qué capturar el problema en lugar de describirlo?
Porque una descripción es una conjetura y una captura no. Cuando escribes «el botón de arriba a la derecha está desalineado», el agente tiene que reconstruir tu pantalla en su cabeza. Cuando envías la captura real, no hay nada que reconstruir. Una captura lleva el detalle visual real, así que el agente actúa sobre lo que ves en lugar de sobre tu mejor intento de narrarlo.
Combina bien con
Sketch
Un lienzo de dibujo en el composer. Captura la pantalla con Screenshot to Agent, luego ábrela en Sketch para rodear el bug, dibujar una flecha o resaltar una zona antes de enviar.
Voice Dictation
Dicta tu prompt en lugar de teclearlo. Combina una instrucción hablada con la captura que acabas de hacer y el agente recibe las dos a la vez.
Prompt Library
Guarda y reutiliza tus mejores prompts. Lanza un prompt guardado junto a una captura fresca y sáltate el tecleo por completo.
Scratchpad
Un bloc de notas para prompts y apuntes en AgentsRoom. Redacta el texto, adjunta la captura, envía todo el contexto al composer de tu agente.
Deja de guardar PNG. Simplemente captúralo.
Descarga AgentsRoom y usa Screenshot to Agent: un botón de captura y un atajo de teclado configurable que capturan una zona de la pantalla y la envían directa a tu agente IA de código, sin herramienta de captura externa y sin mover archivos.
App complementaria: supervisa tus agentes en movimiento
Usa Claude, Codex, Gemini CLI u otro proveedor de IA.
Envía bugs y peticiones directamente a tu backlog público.
Un vistazo a AgentsRoom en acción.