En esta página, se explica cómo conectar tu instancia de Knowledge Catalog (anteriormente Dataplex Universal Catalog) a herramientas para desarrolladores, como Gemini CLI. Conectar Knowledge Catalog a estas herramientas permite el descubrimiento de datos y la administración de recursos basados en IA directamente en tu herramienta.
Para obtener una experiencia integrada de línea de comandos, te recomendamos que uses la extensión dedicada de Knowledge Catalog para Gemini CLI. La extensión incluye un servidor subyacente de Protocolo de contexto del modelo (MCP), que actúa como intermediario entre Gemini CLI y Knowledge Catalog, lo que elimina la necesidad de una configuración de servidor independiente.
Como alternativa, puedes conectar otros IDEs y herramientas para desarrolladores que admitan MCP con una caja de herramientas de MCP local para bases de datos. Luego, puedes usar agentes de IA en tu IDE existente para descubrir recursos de datos en Knowledge Catalog. Para obtener más información sobre MCP, consulta Introducción al Protocolo de contexto del modelo.
En esta guía, se muestra el proceso de conexión para las siguientes herramientas:
- Gemini CLI (a través de la extensión)
- Gemini Code Assist
- Claude Code
- Claude para computadoras de escritorio
- Cline (extensión de VS Code)
- Cursor
- Visual Studio Code (Copilot)
- Windsurf (anteriormente Codeium)
Acerca de Gemini CLI y las extensiones
Gemini CLI es un agente de IA conversacional de código abierto de Google que acelera los flujos de trabajo de desarrollo y ayuda con la programación, la depuración, la exploración de datos y la creación de contenido. Ofrece una experiencia basada en agentes para interactuar con los servicios de Data Cloud, como Knowledge Catalog, y otras bases de datos populares de código abierto.
Para obtener más información sobre Gemini CLI, consulta la documentación de Gemini CLI.
Cómo funcionan las extensiones
Las extensiones amplían las capacidades de Gemini CLI, lo que le permite conectarse a servicios específicos Google Cloud y otras herramientas, y controlarlos. Proporcionan a Gemini contexto y comprensión de la API, lo que permite la interacción conversacional. Puedes cargar extensiones de Gemini CLI desde URLs de GitHub, directorios locales o registros. Estas extensiones ofrecen nuevas herramientas, comandos de barra y mensajes. Estos son independientes de las extensiones de IDE, como Gemini Code Assist, que se integran con MCP Toolbox.
Acerca de la extensión de Knowledge Catalog
La extensión de Knowledge Catalog para Gemini CLI integra la IA en tus tareas de descubrimiento y administración de datos. Puedes interactuar con Knowledge Catalog usando instrucciones en lenguaje natural en tu terminal. Estos son algunos ejemplos:
| Categoría | Herramienta | Ejemplo de instrucción en lenguaje natural |
|---|---|---|
| Descubrimiento y administración de datos | search_entries |
|
lookup_entry |
|
|
search_aspect_types |
|
|
| Conexión del LLM con el contexto | lookup_context (preview) |
|
Para obtener más información sobre la extensión de Knowledge Catalog, consulta la Extensión de Gemini CLI: Knowledge Catalog.
Roles obligatorios
Para obtener los permisos que necesitas para conectarte a Knowledge Catalog con MCP Toolbox o la extensión de Gemini CLI, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto:
-
Para habilitar las APIs:
Administrador Service Usage (
roles/serviceusage.serviceUsageAdmin) -
Para usar las herramientas de Knowledge Catalog:
Visualizador de catálogo de Dataplex (
roles/dataplex.catalogViewer)
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Estos roles predefinidos contienen los permisos necesarios para conectarse a Knowledge Catalog con MCP Toolbox o la extensión de Gemini CLI. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para conectarse a Knowledge Catalog con MCP Toolbox o la extensión de Gemini CLI:
-
Para habilitar las APIs:
serviceusage.services.enable -
Para usar las herramientas de Knowledge Catalog:
-
dataplex.projects.search -
dataplex.entries.get -
dataplex.aspectTypes.get -
dataplex.aspectTypes.list
-
También puedes obtener estos permisos con roles personalizados o otros roles predefinidos.
Habilitar la API de Dataplex
-
En la Google Cloud consola de, ve a la página del selector de proyectos.
-
Selecciona o crea un Google Cloud proyecto de.
Roles necesarios para seleccionar o crear un proyecto
- Seleccionar un proyecto: Para seleccionar un proyecto, no se requiere un rol de IAM específico. Puedes seleccionar cualquier proyecto en el que se te haya otorgado un rol.
-
Crear un proyecto: Para crear un proyecto, necesitas el rol de creador de proyectos
(
roles/resourcemanager.projectCreator), que contiene elresourcemanager.projects.createpermiso. Obtén más información para otorgar roles.
-
Verifica que la facturación esté habilitada para tu Google Cloud proyecto.
Habilitar la API de Dataplex
Roles necesarios para habilitar las APIs
Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (
roles/serviceusage.serviceUsageAdmin), que contiene el permisoserviceusage.services.enable. Obtén más información para otorgar roles.-
Si usas un shell local, crea credenciales de autenticación locales para tu cuenta de usuario:
gcloud auth application-default login
No es necesario que hagas esto si usas Cloud Shell.
Instala MCP Toolbox
No es necesario que instales MCP Toolbox si solo planeas usar Gemini Code Assist o la extensión de Gemini CLI, ya que incluyen las capacidades del servidor requeridas. Para otros IDEs y herramientas, sigue los pasos de esta sección para instalar MCP Toolbox.
Descarga la versión más reciente de MCP Toolbox como un objeto binario. Selecciona el objeto binario que corresponde a tu sistema operativo (SO) y arquitectura de la CPU. Debes usar MCP Toolbox v0.31.0 o una versión posterior.
Linux/amd64
curl -O https://storage.googleapis.com/mcp-toolbox-for-databases/VERSION/linux/amd64/toolbox
Reemplaza
VERSIONpor la versión de MCP Toolbox, por ejemplo,v0.31.0.macOS (Darwin)/arm64
curl -O https://storage.googleapis.com/mcp-toolbox-for-databases/VERSION/darwin/arm64/toolbox
Reemplaza
VERSIONpor la versión de MCP Toolbox, por ejemplo,v0.31.0.macOS (Darwin)/amd64
curl -O https://storage.googleapis.com/mcp-toolbox-for-databases/VERSION/darwin/amd64/toolbox
Reemplaza
VERSIONpor la versión de MCP Toolbox, por ejemplo,v0.31.0.Windows/amd64
curl -O https://storage.googleapis.com/mcp-toolbox-for-databases/VERSION/windows/amd64/toolbox
Reemplaza
VERSIONpor la versión de MCP Toolbox, por ejemplo,v0.31.0.Haz que el objeto binario sea ejecutable:
chmod +x toolboxVerifica la instalación:
./toolbox --versionSi la instalación se realiza correctamente, se muestra el número de versión, por ejemplo, 0.15.0.
Configura clientes y conexiones
En esta sección, se explica cómo conectar Knowledge Catalog a tus herramientas.
Si usas Gemini Code Assist o Gemini CLI independiente, no necesitas instalar ni configurar MCP Toolbox, ya que estas herramientas incluyen las capacidades del servidor requeridas. Para obtener instrucciones de configuración, consulta las pestañas Gemini Code Assist o Extensión de Gemini CLI.
Para otras herramientas y otros IDEs compatibles con MCP, primero debes instalar MCP Toolbox. La caja de herramientas actúa como un servidor de Protocolo de contexto del modelo (MCP) código abierto que se encuentra entre tu IDE y Knowledge Catalog, lo que proporciona un plano de control seguro y eficiente para tus herramientas de IA. Después de la instalación, selecciona la pestaña de tu herramienta específica para ver las instrucciones de configuración.
Extensión de Gemini CLI
Este método usa la extensión knowledge-catalog dedicada para la herramienta Gemini CLI independiente y no usa MCP Toolbox.
- Instala el Gemini CLI.
- Instala la extensión de Knowledge Catalog para Gemini CLI desde el repositorio de GitHub:
gemini extensions install https://github.com/gemini-cli-extensions/knowledge-catalog
- Configura la variable de entorno para conectarte a tu proyecto de Knowledge Catalog:
export DATAPLEX_PROJECT="PROJECT_ID"
Reemplaza
PROJECT_IDpor el ID del Google Cloud proyecto. - Inicia Gemini CLI en modo interactivo:
La CLI carga automáticamente la extensión de Knowledge Catalog y sus herramientas, que puedes usar para interactuar con tus recursos de datos.gemini
Gemini Code Assist
Gemini Code Assist incluye las capacidades del servidor de MCP requeridas, por lo que no necesitas instalar MCP Toolbox por separado.
- En VS Code, instala la extensión de Gemini Code Assist.
- Habilita el modo de agente en el chat de Gemini Code Assist.
- En tu directorio de trabajo, crea una carpeta llamada
.gemini. Dentro de ella, crea un archivosettings.json. - Agrega la siguiente configuración, reemplaza las variables de entorno por
tus valores y guarda:
{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Claude Code
- Instala Claude Code.
- Crea el archivo
.mcp.jsonen la raíz de tu proyecto, si no existe. - Agrega la configuración, reemplaza las variables de entorno por tus valores y guarda:
{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Claude para computadoras de escritorio
- Abre Claude para computadoras de escritorio y navega a Configuración.
- Para abrir el archivo de configuración, en la pestaña Desarrollador, haz clic en Editar configuración.
- Agrega la configuración, reemplaza las variables de entorno por tus valores,
y guarda:
{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } } - Reinicia Claude para computadoras de escritorio.
En la nueva pantalla de chat, se muestra un ícono de MCP con el nuevo servidor de MCP.
Cline
- En VS Code, abre la extensión de Cline y, luego, haz clic en el ícono de servidores de MCP.
- Para abrir el archivo de configuración, presiona Configurar servidores de MCP.
- Agrega la siguiente configuración, reemplaza las variables de entorno por
tus valores y guarda:
Aparecerá un estado activo verde después de que el servidor se conecte correctamente.{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Cursor
- Crea el directorio
.cursoren la raíz de tu proyecto si no existe. - Crea el archivo
.cursor/mcp.jsonsi no existe y ábrelo. - Agrega la siguiente configuración, reemplaza las variables de entorno por
tus valores y guarda:
{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } } - Abre Cursor y navega a Configuración > Configuración del cursor > MCP. Aparecerá un estado activo verde cuando el servidor se conecte.
VS Code (Copilot)
- Abre VS Code
y crea el directorio
.vscodeen la raíz de tu proyecto si no existe. - Crea el archivo
.vscode/mcp.jsonsi no existe y ábrelo. - Agrega la siguiente configuración, reemplaza las variables de entorno por
tus valores y guarda:
{ "servers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Windsurf
- Abre Windsurf y navega al asistente de Cascade.
- Para abrir el archivo de configuración, haz clic en el ícono de MCP y, luego, en Configurar.
- Agrega la siguiente configuración, reemplaza las variables de entorno por
tus valores y guarda:
{ "mcpServers": { "knowledgeCatalog": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Usa las herramientas
Tu herramienta de IA ahora está conectada a Knowledge Catalog. Intenta pedirle a tu asistente de IA que encuentre algunos recursos de datos, como conjuntos de datos de BigQuery, instancias de Cloud SQL y otros.
Las siguientes herramientas están disponibles para el LLM:
- search_entries: Busca recursos de datos.
- lookup_entry: Recupera metadatos (por ejemplo, esquema, uso, información general de la empresa y contactos) de los recursos de datos.
- search_aspect_types: Busca tipos de aspectos.
- lookup_context (vista previa): Recupera un conjunto enriquecido de metadatos con formato previo sobre uno o más recursos de datos.
Opcional: Agrega instrucciones del sistema
Las instrucciones del sistema son una forma de proporcionar lineamientos específicos al LLM, lo que lo ayuda a comprender el contexto y responder con mayor precisión. Configura las instrucciones del sistema según la instrucción del sistema recomendada.
Por ejemplo, puedes agregar instrucciones para guiar al LLM sobre cómo usar las herramientas de Knowledge Catalog:
- Cuando se te solicite encontrar conjuntos de datos o tablas, usa la herramienta
search_entries. - Si se te solicita el esquema de la tabla o detalles de los metadatos, como las reglas de calidad de los datos o la propiedad, usa la herramienta
lookup_entry. - Cuando se te pregunte sobre las reglas o clasificaciones de administración, comienza usando
search_aspect_typespara encontrar tipos de aspectos relevantes. - Si responder preguntas requiere un conjunto amplio de metadatos, usa la herramienta
lookup_contextpara recuperarlos.
Para obtener más información sobre cómo configurar instrucciones, consulta Usa instrucciones para obtener ediciones de IA que sigan tu estilo de programación.
¿Qué sigue?
- Busca recursos en Knowledge Catalog.
- Obtén información para transferir fuentes personalizadas a Knowledge Catalog.
- Obtén información para administrar aspectos y enriquecer metadatos.
- Consulta el caso de uso Cómo usar el agente de Gemini CLI para obtener contexto de datos.