En este documento, se describe el modo agente en Gemini Code Assist.
El modo agente está disponible en los entornos de desarrollo integrados (IDEs) de VS Code y IntelliJ. Para comenzar a usar el modo agente, consulta Usa el modo agente de Gemini Code Assist.
Con el modo agente, puedes hacer lo siguiente y mucho más:
- Haz preguntas sobre tu código.
- Usa el contexto y las herramientas integradas para mejorar el contenido generado.
- Configura servidores de MCP para ampliar las capacidades del agente.
- Obtén soluciones para tareas complejas con varios pasos.
- Genera código a partir de documentos de diseño, problemas y comentarios
TODO. - Controla el comportamiento del agente comentando, editando y aprobando planes y el uso de herramientas durante la ejecución.
Cómo funciona el modo agente
En el modo agente, tu instrucción se envía a la API de Gemini con una lista de herramientas disponibles. La API de Gemini procesa la instrucción y devuelve una respuesta. La respuesta puede ser una respuesta directa o una solicitud para usar una herramienta disponible.
Cuando se solicita una herramienta, el agente se prepara para usarla y verifica si tiene permiso para usarla con o sin permiso explícito:
- Para las solicitudes de herramientas que modifican el sistema de archivos o realizan operaciones de mutación en cualquier recurso, Gemini te pedirá que permitas la operación, a menos que hayas configurado Gemini para que siempre permita la herramienta o las herramientas.
- Es posible que las solicitudes de herramientas de solo lectura no soliciten permiso antes de completar la tarea.
Cuando se te solicite permitir el uso de una herramienta, puedes elegir permitir o rechazar la operación. El agente también puede darte opciones para permitir siempre una herramienta o un servidor, o permitir operaciones similares. Para obtener más información, consulta Permitir siempre las acciones del agente.
Una vez que se otorga o se otorga automáticamente el permiso para usar la herramienta, el agente la usa para completar la acción requerida y el resultado de esa acción se envía de vuelta a la API de Gemini. Gemini procesa el resultado de la acción de la herramienta y genera otra respuesta. Este ciclo de acción y evaluación continúa hasta que se completa la tarea.
Para tareas complejas, Gemini puede mostrar un plan de alto nivel para tu aprobación. Puedes ajustar el plan y hacer preguntas en el chat antes de comenzar el proceso. Una vez que estés satisfecho con el plan, puedes aprobarlo. Después de aprobar el plan, el agente comienza a trabajar en la primera tarea y te pedirá aclaraciones o permisos según sea necesario mientras ejecuta el plan.
Contexto del modo agente
El contexto permite que un agente genere mejores respuestas para una instrucción determinada. El contexto se puede obtener de los archivos de tu IDE, los archivos de las carpetas del sistema local, las respuestas de las herramientas y los detalles de tu instrucción.
Según tu IDE y configuración, es posible que el agente tenga diferentes contextos disponibles.
En las siguientes pestañas, se detalla cómo se recopila el contexto para diferentes IDEs.
VS Code
Por lo general, los siguientes métodos para obtener contexto están disponibles para Gemini Code Assist en el modo agente:
- Información en tu espacio de trabajo del IDE
- Respuestas de herramientas integradas, como grep, terminal, lectura de archivos o escritura de archivos
- Respuestas de la Búsqueda de Google
- Contenido de una URL determinada proporcionada en una instrucción o por una herramienta
- Archivos de contexto que creas en Markdown
IntelliJ
Por lo general, los siguientes métodos para obtener contexto están disponibles para Gemini Code Assist en el modo agente:
- Información en tu proyecto de IDE, incluidos tus archivos, símbolos indexados y uso de símbolos en tu proyecto
- Respuestas de herramientas integradas, como grep, lectura de archivos o escritura de archivos
- Control de versiones de IntelliJ .
- Servidores y herramientas de MCP configurados
- Archivos de contexto que creas en Markdown
Puedes ver el contexto disponible para el agente en el panel de contexto en el área de instrucciones de chat del modo agente.
Herramientas
Las herramientas son una amplia categoría de servicios que un agente puede usar para obtener contexto y realizar acciones en su respuesta a tu instrucción. Las herramientas permiten que los agentes accedan a información actualizada a través de llamadas a funciones a extremos de la API o a otros agentes. Es posible que las herramientas solo ofrezcan una función o que ofrezcan varias funciones relacionadas.
Algunas herramientas de ejemplo son las integradas, como grep y la lectura o escritura de archivos, los servidores locales o remotos de Protocolo de contexto del modelo (MCP) y sus funciones ejecutables, y las llamadas a la API de RESTful.
Herramientas integradas
En el modo agente, Gemini tiene acceso a tus herramientas del sistema integradas. Selecciona tu IDE para ver una lista de las herramientas integradas disponibles para Gemini en el modo agente.
VS Code
Todas las herramientas integradas de Gemini CLI están disponibles para el modo agente en Gemini Code Assist.
IntelliJ
read_file- Recupera el contenido de texto de un archivo con su ruta de acceso absoluta.
write_file- Escribe el texto determinado en un archivo especificado y crea el archivo si no existe.
analyze_current_file- Analiza el archivo abierto en el editor en busca de errores y advertencias.
find_files- Busca la ruta de acceso absoluta a los archivos dado un nombre de archivo o una parte de la ruta.
grep- Busca todos los archivos dentro del proyecto que contengan un patrón de texto o una expresión regular determinados.
list_files- Muestra todos los archivos y directorios en una ruta de acceso absoluta determinada.
resolve_symbol- Resuelve una referencia de símbolo específica a su declaración original.
find_usages- Busca en el proyecto todas las referencias a una declaración de símbolo determinada.
git- Ejecuta un comando de la interfaz de línea de comandos (CLI) de Git y devuelve el resultado.
list_vcs_roots- Devuelve todas las raíces del sistema de control de versiones (VCS), como los repositorios de Git, en el proyecto actual.
Limitaciones
Es posible que algunas funciones del chat estándar de Gemini Code Assist no estén disponibles en el modo agente o que funcionen de manera diferente a como lo hacen en el chat estándar.
La recitación no está disponible en el modo agente. En el modo agente, Gemini no cita fuentes y no puedes inhabilitar las sugerencias de código que coincidan con las fuentes citadas.¿Qué sigue?
- Usa el modo agente de Gemini Code Assist.
- Obtén información sobre las cuotas del modo agente.