Screenshot to Agent: captura una zona de la pantalla, envíasela a tu agente IA

Captura tu pantalla,
envía la captura directa a tu agente IA

Screenshot to Agent coloca un botón de captura justo en el composer del agente IA y te da un atajo de teclado configurable para capturar una zona de la pantalla desde cualquier sitio. Pulsa el atajo o haz clic en el botón, dibuja un recuadro alrededor de lo que quieras y la captura se adjunta sola a tu siguiente mensaje. La captura aterriza junto a tu prompt y llega directa a tu agente IA de código.

Sin herramienta de captura externa, sin guardar un PNG en el escritorio, sin buscar el archivo para arrastrarlo a la ventana. Te ahorras todo el baile de capturar, guardar, localizar y soltar, y ganas unos segundos cada vez, que es justo el objetivo: una comunicación más ajustada y de mayor fidelidad entre tú y tu agente.

Screenshot to Agent en acción: pulsa el atajo de teclado, dibuja un recuadro alrededor de la zona de la pantalla y la captura se adjunta sola al mensaje de tu agente IA.

Este es el flujo que Screenshot to Agent elimina. Estás haciendo vibe coding con un agente IA y algo en pantalla no cuadra: una tarjeta mal alineada, un color erróneo, un error de consola, un layout que se rompe a cierto ancho. Para enseñárselo al agente, recurres a una herramienta de capturas aparte, dibujas una zona, guardas un PNG en algún sitio, buscas ese archivo y lo arrastras al composer. Cinco pasos, un cambio de contexto, y la conversación con tu agente queda en pausa todo ese rato.

Screenshot to Agent reduce todo eso a un solo gesto. Pulsas un atajo de teclado, aparece el selector de región de tu propio sistema operativo, dibujas un recuadro y la captura queda hecha y adjuntada al composer del agente automáticamente. Sin app externa que abrir, sin archivo que guardar, sin archivo que localizar, sin arrastrar y soltar. La captura está junto a tu prompt, lista para enviar.

Son dos puntos de entrada para lo mismo. Un botón de captura en el composer cuando ya tienes la mano en el ratón, y un atajo global personalizable cuando quieres capturar la pantalla desde cualquier sitio sin tener que hacer clic primero. En ambos casos el resultado es idéntico: una captura, adjunta a tu mensaje, de camino a tu agente IA de código en segundos.

Dos formas de enviar una captura

Un botón cuando tienes la mano en el ratón, un atajo cuando la tienes en el teclado. El mismo resultado.

El botón de captura en el composer

Cada composer de agente tiene un botón de captura. Haz clic y se abre el selector de región de tu sistema operativo para que dibujes un recuadro alrededor de cualquier parte de tu pantalla. La captura se guarda y se adjunta al composer de ese agente como miniatura, lista para enviar. Es el camino evidente cuando ya estás en el composer y la mano va al ratón.

El atajo de teclado configurable

Un atajo de teclado global, Cmd+Shift+2 por defecto en macOS (Ctrl+Shift+2 en Windows y Linux), dispara la misma captura de región desde cualquier sitio, incluso cuando AgentsRoom no es la ventana activa. La captura se enruta al composer de tu agente activo automáticamente. El atajo es totalmente personalizable: reasígnalo a la combinación que quieras, o desactívalo, en Ajustes.

Screenshot to Agent de AgentsRoom: una zona de la pantalla capturándose con un recuadro de selección y el atajo Cmd+Shift+2, luego adjuntada como miniatura en el composer del agente IA junto al prompt

Captura una zona de la pantalla con el atajo o el botón del composer, y la captura se adjunta sola al mensaje de tu agente IA como miniatura, lista para enviar con tu prompt.

Por qué Screenshot to Agent encaja en tu flujo con agentes

Velocidad. Capturar una zona de la pantalla y ponerla delante de tu agente eran cinco pasos repartidos en dos apps. Ahora es un atajo y un arrastre. Te ahorras unos segundos en cada captura, y cuando capturas para el agente decenas de veces al día, esos segundos se convierten en flow de verdad.

Precisión. Una captura le muestra al agente exactamente lo que ves, píxel a píxel, en lugar de un párrafo intentando describirlo. El padding mal puesto, la alineación rota, el error en la esquina: el agente recibe la imagen real, no tu mejor intento de narrarla.

Sin herramienta externa. No abres una app de capturas aparte, no llenas el escritorio de archivos PNG, no rebuscas en el Finder para encontrar la que acabas de hacer. La captura y el adjunto ocurren en una sola acción, dentro de AgentsRoom.

Flow. El atajo funciona desde cualquier sitio y la captura vuelve al composer junto a tu prompt. Nunca sales del terminal, nunca rompes la conversación con el agente, y tu captura y tus instrucciones escritas viajan juntas en el mismo mensaje.

Cómo funciona Screenshot to Agent, de principio a fin

De un atajo de teclado a una captura adjunta al mensaje de tu agente.

01

Dispara la captura

Pulsa el atajo de teclado (Cmd+Shift+2 por defecto) desde cualquier sitio, o haz clic en el botón de captura dentro del composer del agente. Ambos inician exactamente la misma captura de región.

02

Dibuja un recuadro alrededor de la zona

El propio selector de región de tu sistema operativo toma el control: una cruz en macOS vía screencapture, el overlay de Snip en Windows, grim, spectacle o gnome-screenshot en Linux. Dibuja un recuadro alrededor de la parte de la pantalla que quieras. Es la interfaz de captura que ya conoces.

03

La captura se adjunta sola

La zona capturada se guarda como PNG y se deja directamente en el composer del agente activo como miniatura, igual que un archivo que arrastraste. Sin guardar en el escritorio, sin localizar el archivo, sin arrastrar y soltar. Ya está ahí.

04

Escribe tu prompt alrededor

Escribe tu mensaje como siempre. Haz referencia a la captura con tus palabras si quieres, o deja que la captura adjunta hable por sí misma. La captura aparece como un archivo numerado en el composer, así que puedes señalársela al agente de forma explícita.

05

Envíasela al agente

Pulsa enviar. El PNG sale con tu mensaje por el mismo canal que cualquier otro adjunto. Tu captura y tus instrucciones escritas llegan al agente juntas, en un solo turno.

06

El agente lee tu pantalla

Tu agente IA de código recibe la captura como imagen adjunta. Mientras su modelo acepte entrada de imágenes, ve exactamente lo que había en tu pantalla y actúa en consecuencia, en lugar de interpretar un párrafo que intenta describir un problema visual.

Qué es Screenshot to Agent en realidad

Screenshot to Agent es un flujo de captura de región conectado directamente a la app de escritorio de AgentsRoom. No es un visor de capturas pegado al lado. Se engancha al selector de región nativo de tu sistema operativo, la misma cruz de screencapture en macOS, el mismo overlay de Snip en Windows, las mismas herramientas grim, spectacle, gnome-screenshot, maim, scrot o flameshot en Linux, así que la experiencia de captura es la que ya usas, sin nada nuevo que aprender.

Los dos disparadores, el botón del composer y el atajo de teclado global, ejecutan la misma captura y terminan igual: la captura se adjunta al composer del agente activo. El atajo es global, así que se dispara incluso cuando AgentsRoom está en segundo plano, y es totalmente configurable. Lo reasignas o lo desactivas desde los ajustes del composer, donde un grabador de atajos te deja pulsar la combinación exacta que quieras.

Una vez capturado, el PNG se guarda en local y se añade a la bandeja de archivos del composer como miniatura, donde recibe un número de referencia como cualquier archivo soltado. A partir de ahí sigue el camino normal: sale con tu prompt y se envía al agente como imagen. Screenshot to Agent no inventa un mecanismo de envío nuevo, se conecta al que ya mueve archivos a tu agente.

Todo se queda en tu máquina. Las capturas se guardan en una carpeta local de tu directorio personal, no dentro del repositorio de tu proyecto ni en ningún servicio de terceros, y se limpian automáticamente para que nunca se acumulen. Screenshot to Agent es local, privado y agnóstico de proveedor: adjunta un PNG normal, así que cualquier agente cuyo modelo acepte una imagen puede leerlo, lo que significa que las configuraciones de Claude Code y Codex obtienen el mismo flujo de captura a agente. Es una funcionalidad de escritorio, disponible en macOS, Windows y Linux.

Qué captura la gente para su agente

Tres momentos en los que una captura gana a un párrafo de descripción.

Muestra un bug visual o de UI

Captura la interfaz rota, el elemento desalineado, el espaciado erróneo, el error de consola, y envíalo. El agente ve el bug real en lugar de descifrar tu descripción de él. La forma más rápida de reportar una regresión de UI a un agente IA de código.

Señala lo que hay en pantalla

Un gráfico, una salida de terminal, un diff, un dashboard de terceros, cualquier cosa visible en tu pantalla. Captura la zona y dásela al agente como contexto en lugar de reescribir lo que dice. La captura lleva el detalle que tus palabras dejarían fuera.

Pasa una referencia visual

Un diseño que estás replicando, un layout que te gusta, un componente de otra app. Haz una captura de la referencia y dásela al agente como objetivo, luego deja que construya hacia lo que capturaste.

Descríbelo, o simplemente captúralo

La misma pantalla, el mismo agente. Un camino es una tarea de cinco pasos, el otro es un atajo.

Sin Screenshot to Agent

  • : Abres una herramienta de captura aparte, dibujas una zona y guardas un PNG en algún sitio.
  • : Buscas ese archivo y luego lo arrastras y sueltas en el composer.
  • : O te rindes e intentas describir el problema visual con palabras.
  • : El cambio de contexto rompe tu flow y pausa la conversación con el agente.
  • : Cada captura te cuesta los mismos segundos, durante todo el día.

Con Screenshot to Agent

  • : Pulsas el atajo o haces clic en el botón y dibujas un recuadro. Un solo gesto.
  • : La captura se adjunta sola al composer automáticamente.
  • : Sin app externa, sin archivo guardado, sin localizarlo, sin arrastrar y soltar.
  • : Nunca sales de AgentsRoom y nunca rompes el hilo con el agente.
  • : La captura y tu prompt llegan al agente juntos, en un solo turno.

Screenshot to Agent es el camino más corto entre lo que hay en tu pantalla y un agente IA que puede verlo.

Local y privado
Tus capturas se guardan en tu propia máquina, en tu carpeta personal, nunca se commitean a tu repositorio ni se envían a un servicio de capturas de terceros. Las capturas antiguas se limpian automáticamente.
Funciona con todos los proveedores
Screenshot to Agent adjunta un PNG normal. Cualquier agente IA cuyo modelo acepte entrada de imágenes puede leerlo: Claude Code, Codex y más allá. No hay configuración específica por proveedor.
Sin cambio de contexto
La captura se dispara desde un botón o un atajo global y la captura vuelve al composer. Te quedas en el terminal y la conversación con el agente nunca se rompe.

FAQ

¿Qué es Screenshot to Agent en AgentsRoom?

Screenshot to Agent es una forma integrada de capturar una zona de tu pantalla y enviarla directa a tu agente IA de código. Lo disparas desde un botón de captura en el composer del agente o desde un atajo de teclado global configurable, dibujas un recuadro con el selector de región de tu sistema operativo y la captura se adjunta sola a tu siguiente mensaje. Sin herramienta de captura externa y sin mover archivos.

¿Cómo envío una captura a un agente IA?

Pulsa el atajo de teclado (Cmd+Shift+2 por defecto, Ctrl+Shift+2 en Windows y Linux) o haz clic en el botón de captura del composer, luego dibuja un recuadro alrededor de la parte de tu pantalla que quieras. La captura queda hecha y adjuntada al composer del agente como miniatura. Escribe tu prompt y envía: la captura llega al agente junto con tu texto.

¿Cuál es el atajo de teclado por defecto, y puedo cambiarlo?

El predeterminado es Cmd+Shift+2 en macOS y Ctrl+Shift+2 en Windows y Linux. Es un atajo global, así que se dispara incluso cuando AgentsRoom no es la ventana activa. Puedes reasignarlo a cualquier combinación que quieras, o desactivarlo del todo, en los ajustes del composer, donde un grabador de atajos te deja pulsar las teclas exactas que quieras.

¿Funciona cuando AgentsRoom está en segundo plano?

Sí. El atajo de teclado está registrado globalmente, así que puedes capturar una zona de la pantalla desde cualquier app y la captura se enruta al composer de tu agente activo en AgentsRoom. No tienes que traer la ventana al frente primero.

¿Necesito una herramienta de captura externa?

No, ese es justo el objetivo. Screenshot to Agent usa el propio selector de región de tu sistema operativo (screencapture en macOS, el overlay de Snip en Windows, grim, spectacle o gnome-screenshot en Linux) y adjunta el resultado por ti. No abres una app de capturas aparte, no guardas un PNG en el escritorio y no arrastras un archivo a la ventana.

¿Dónde se guardan mis capturas? ¿Son privadas?

Las capturas se guardan en una carpeta local de tu directorio personal, en tu propia máquina. No se commitean al repositorio de tu proyecto ni se suben a ningún servicio de terceros. Son transitorias por diseño y se limpian automáticamente, así que no se acumulan con el tiempo.

¿Qué agentes y proveedores funcionan con Screenshot to Agent?

Adjunta una imagen PNG estándar, así que es agnóstico de proveedor. Cualquier agente cuyo modelo acepte entrada de imágenes funciona: Claude Code, Codex y los demás CLI que AgentsRoom soporta. No hay configuración específica por proveedor que hacer.

¿Puedo capturar solo una parte de la pantalla?

Sí. El selector de región te deja dibujar un recuadro alrededor de exactamente la parte de la pantalla que quieras, así que envías solo el área relevante en lugar de una captura de pantalla completa. Recortas en el momento de capturar, con la interfaz de selección nativa que ya conoces.

¿Puedo anotar la captura antes de enviarla?

Screenshot to Agent adjunta la captura en bruto. Si quieres rodear un bug, dibujar una flecha o resaltar una zona encima, abre la captura en Sketch, el lienzo de dibujo del composer, anótala, y la versión marcada va al agente. Captura con Screenshot to Agent, márcala con Sketch.

¿Por qué capturar el problema en lugar de describirlo?

Porque una descripción es una conjetura y una captura no. Cuando escribes «el botón de arriba a la derecha está desalineado», el agente tiene que reconstruir tu pantalla en su cabeza. Cuando envías la captura real, no hay nada que reconstruir. Una captura lleva el detalle visual real, así que el agente actúa sobre lo que ves en lugar de sobre tu mejor intento de narrarlo.

Combina bien con

Deja de guardar PNG. Simplemente captúralo.

Descarga AgentsRoom y usa Screenshot to Agent: un botón de captura y un atajo de teclado configurable que capturan una zona de la pantalla y la envían directa a tu agente IA de código, sin herramienta de captura externa y sin mover archivos.

GratisDescargar AgentsRoom

App complementaria: supervisa tus agentes en movimiento

Usa Claude, Codex, Gemini CLI u otro proveedor de IA.

Instalar la extensión
Chrome Web Store

Envía bugs y peticiones directamente a tu backlog público.

Un vistazo a AgentsRoom en acción.

Multi-proyectos
Multi-proveedor
Multi-agentes
Estado en vivo
Diff y commit
App móvil
Vista previa
Equipos de agentes
Pruebas en navegador
Dev guiada por backlog
Biblioteca de prompts
Biblioteca de skills
Ver todas las funcionalidades