Prueba las capacidades del modelo en Model Garden

Model Garden te ofrece varias opciones para ver y probar rápidamente las capacidades de los modelos. En el caso de los modelos compatibles, puedes probar los espacios de pruebas de demostración o lanzar aplicaciones de demostración llamadas Model Garden Spaces que puedes compartir con otras personas para mostrar las capacidades de un modelo.

Los Playgrounds funcionan con endpoints de predicción en línea de Agent Platform de Gemini Enterprise implementados previamente y no generan cargos. Cuando abres la tarjeta de modelo para un modelo compatible, puedes usar el panel Probar para probar rápidamente las capacidades del modelo enviando una instrucción de texto. También puedes establecer algunos de los parámetros más comunes, como la temperatura y la cantidad de tokens de salida. El Playground se limita a la entrada y salida de texto.

Cuando lanzas Spaces, tienes una aplicación web funcional lista para usar con mucho menos esfuerzo manual que implementar un modelo y compilar una app para usar el extremo del modelo. Model Garden implementa el modelo seleccionado en la plataforma de agentes de Gemini Enterprise y la app de ejemplo en una instancia de Cloud Run que usa el extremo del modelo implementado. La aplicación también puede usar extremos existentes o un extremo de MaaS.

Antes de comenzar

En este instructivo, debes configurar un proyecto Google Cloud y habilitar la API de Agent Platform.

  1. Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  10. Si quieres probar Model Garden Spaces, verifica que la cuenta de servicio predeterminada de Compute Engine tenga los permisos necesarios para iniciar Spaces.

Roles obligatorios

Para probar las capacidades del modelo en Model Garden, asegúrate de que tú y la cuenta de servicio predeterminada de Compute Engine tengan los roles de IAM necesarios.

Roles obligatorios para los usuarios

Para obtener los permisos que necesitas para probar las capacidades del modelo en Model Garden, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto de Google Cloud :

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Funciones necesarias para la cuenta de servicio predeterminada de Compute Engine

La cuenta de servicio predeterminada de Compute Engine se usa para iniciar Spaces.

Para asegurarte de que la cuenta de servicio predeterminada de Compute Engine tenga los permisos necesarios para iniciar Espacios, pídele a tu administrador que le otorgue los siguientes roles de IAM a la cuenta de servicio predeterminada de Compute Engine en tu proyecto Google Cloud :

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Es posible que tu administrador también pueda otorgarle los permisos necesarios a la cuenta de servicio predeterminada de Compute Engine a través de roles personalizados o de otros roles predefinidos.

Prueba un Playground

  1. En la consola de Google Cloud , ve a la tarjeta de modelo de un modelo compatible, como la tarjeta de modelo de Gemma 2.

    Ir a Gemma 2

  2. En el panel Probar, haz lo siguiente:

    1. En Región, acepta el valor predeterminado o elige tu región.
    2. En Endpoint, selecciona Demo playground.
    3. En el cuadro Mensaje, ingresa Why is the sky blue?.
    4. Expande la sección Opciones avanzadas y consulta los parámetros predeterminados.

    El panel de prueba de Gemma 2b-it

  3. Haz clic en Enviar. El resultado aparece debajo del botón Enviar.

Prueba Spaces

Para iniciar un modelo, abre la tarjeta del modelo compatible y, en el panel Probar espacios, haz clic en un espacio para iniciarlo. Se te cobra por las máquinas que se usan para la implementación y por la instancia de Cloud Run que aloja la app.

Puedes lanzar Spaces con modelos como Gemini, Gemma, Llama y Stable Diffusion.

Lanzar espacios

Inicia Spaces para probar y experimentar con un modelo de una aplicación de muestra de Gradio.

  1. En la consola de Google Cloud , ve a Model Garden para ver la tarjeta de modelo de un modelo.

    Ir a Model Garden

  2. Selecciona el modelo que deseas usar. Los modelos compatibles tienen un panel Probar Spaces, como la tarjeta del modelo Gemma 3.

    Ir a Gemma 3

  3. Haz clic en rocket_launch Ejecutar para iniciar un espacio.

    1. Puedes elegir Exigir autenticación (a través de Identity-Aware Proxy) o Permitir acceso público. Para obtener más información, consulta Habilita las APIs para la primera implementación y otorga permisos.
    1. Haz clic en Crear servicio nuevo para iniciar la implementación. Puedes supervisar el estado de la implementación desde la tarjeta del modelo.
  4. Cuando el estado de Spaces cambie a Listo, haz clic en él para ver los detalles de la implementación.

    Para la protección básica, la aplicación web requiere una clave secreta que debe agregarse a la URL cuando se envían instrucciones. Esta clave secreta se proporciona en el campo Clave secreta.

    1. Haz clic en Abrir para comenzar a usar la app. Puedes enviar instrucciones al modelo y ver sus respuestas desde la app.

    Puedes compartir la URL para que otras personas también prueben la app.

    1. Para cerrar el acceso a la app, haz clic en Editar en el campo Control de acceso.

    En la pestaña Seguridad de tu aplicación de Cloud Run, selecciona Solicitar autenticación y, luego, haz clic en Guardar. La aplicación ya no está disponible a través de la URL. Las visitas a la URL generan un error 403 (prohibido).

Realiza una limpieza

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

Borra espacios

Para limpiar Spaces, debes borrar los recursos del modelo y los de la aplicación de ejemplo en Cloud Run.

Borra los recursos del modelo

Desde la app de Gradio, puedes borrar extremos de modelos para limpiar los recursos de la plataforma de agentes de Gemini Enterprise. Luego, debes borrar el servicio de Cloud Run para detener y borrar la app de Gradio.

Para borrar manualmente los recursos de la plataforma de agentes de Gemini Enterprise, consulta Cómo anular la implementación de modelos y borrar recursos.

Borra el servicio de Cloud Run

Borra los recursos relacionados con un servicio, incluidas todas las revisiones del servicio. Borrar un servicio no incluye elementos como las imágenes de contenedor de Artifact Registry. Para obtener más información, consulta Administración de servicios en la documentación de Cloud Run.

  1. En la consola Google Cloud , consulta la lista de servicios de Cloud Run:

    Ir a Cloud Run

  2. Busca el servicio que deseas borrar y, luego, selecciónalo.

  3. Haz clic en borrar Borrar. Esta acción borra todas las revisiones del servicio.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

¿Qué sigue?

Consulta una descripción general de Model Garden.