Prueba las capacidades del modelo en Model Garden

Model Garden te ofrece varias opciones para ver y probar rápidamente las capacidades de los modelos. En el caso de los modelos compatibles, puedes probar áreas de juegos de demostración o iniciar aplicaciones de demostración llamadas Model Garden Spaces que puedes compartir con otras personas para mostrar las capacidades de un modelo.

Las áreas de juegos funcionan con extremos de predicción en línea de Vertex AI implementados previamente y no generan cargos. Cuando abres la tarjeta de modelo de un modelo compatible, puedes usar el panel Probar para probar rápidamente las capacidades del modelo enviando una instrucción de texto. También puedes configurar algunos de los parámetros más comunes, como la temperatura y la cantidad de tokens de salida. El área de juegos se limita a la entrada y salida de texto.

Cuando inicias Spaces, tienes una aplicación web en funcionamiento que está lista para usar con mucho menos esfuerzo manual que implementar un modelo y compilar una app para usar el extremo del modelo. Model Garden implementa el modelo seleccionado en Vertex AI y la app de muestra en una instancia de Cloud Run que usa el extremo del modelo implementado. La aplicación también puede usar extremos existentes o un extremo de MaaS.

Antes de comenzar

En este instructivo, debes configurar un Google Cloud proyecto y habilitar la API de Vertex AI.

  1. Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Vertex AI, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Vertex AI, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  10. Si quieres probar Model Garden Spaces, entonces verifica que la cuenta de servicio predeterminada de Compute Engine tenga los permisos necesarios para iniciar Spaces.

Roles obligatorios

Para probar las capacidades del modelo en Model Garden, asegúrate de que tú y la cuenta de servicio predeterminada de Compute Engine tengan los roles de IAM necesarios.

Roles obligatorios para los usuarios

Para obtener los permisos que necesitas para probar las capacidades del modelo en Model Garden, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu Google Cloud proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Funciones necesarias para la cuenta de servicio predeterminada de Compute Engine

La cuenta de servicio predeterminada de Compute Engine se usa para iniciar Spaces.

Para asegurarte de que la cuenta de servicio predeterminada de Compute Engine tenga los permisos necesarios para iniciar Spaces, pídele a tu administrador que otorgue los siguientes roles de IAM a la cuenta de servicio predeterminada de Compute Engine en tu Google Cloud proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Es posible que tu administrador también pueda otorgarle los permisos necesarios al agente de servicio de Compute Engine mediante roles personalizados o cualquier otro rol predefinido.

Prueba un área de juegos

  1. En la Google Cloud consola, ve a la tarjeta de modelo de un modelo compatible, como la tarjeta de modelo de Gemma 2.

    Ir a Gemma 2

  2. En el panel Probar , haz lo siguiente:

    1. En Región, acepta el valor predeterminado o elige tu región.
    2. En Extremo, selecciona Área de juegos de demostración.
    3. En el cuadro Instrucción, ingresa Why is the sky blue?.
    4. Expande la sección Opciones avanzadas y consulta los parámetros predeterminados.

    El panel de prueba de Gemma 2b-it

  3. Haz clic en Enviar. El resultado aparece debajo del botón Enviar.

Prueba Spaces

Para iniciar un modelo, abre la tarjeta de modelo del modelo compatible y, en el panel Probar Spaces, haz clic en un espacio para iniciarlo. Se te cobrará por las máquinas que se usen para la implementación y por la instancia de Cloud Run que aloja la app.

Puedes iniciar Spaces con modelos como Gemini, Gemma, Llama y Stable Diffusion.

Inicia Spaces

Inicia Spaces para probar y experimentar con un modelo desde una aplicación de Gradio de muestra.

  1. En la Google Cloud consola, ve a Model Garden para ver la tarjeta de modelo de un modelo.

    Ir a Model Garden

  2. Selecciona el modelo que deseas usar. Los modelos compatibles tienen un panel Probar Spaces, como la tarjeta de modelo de Gemma 3.

    Ir a Gemma 3

  3. Haz clic en rocket_launch Ejecutar para iniciar un espacio.

    1. Puedes elegir Requerir autenticación (a través de Identity-Aware Proxy) o Permitir acceso público. Para obtener más información, consulta Habilita las APIs para la primera implementación y otorga permisos.
    1. Haz clic en Crear servicio nuevo para iniciar la implementación. Puedes supervisar el estado de la implementación desde la tarjeta de modelo.
  4. Una vez que el estado de Spaces cambie a Listo, haz clic en él para ver los detalles de la implementación.

    Para la protección básica, la aplicación web requiere una clave secreta que se debe agregar a la URL cuando se envían instrucciones. Esta clave secreta se proporciona en el campo Clave secreta.

    1. Haz clic en Abrir para comenzar a usar la app. Puedes enviar instrucciones al modelo y ver sus respuestas desde la app.

    Puedes compartir la URL para que otras personas también puedan probar la app.

    1. Para cerrar el acceso a la app, haz clic en Editar en el campo Control de acceso.

    En la pestaña Seguridad de tu aplicación de Cloud Run, selecciona Requerir autenticación y, luego, haz clic en Guardar. La aplicación ya no está disponible a través de la URL. Las visitas a la URL generan un error 403 (prohibido).

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu Google Cloud cuenta de por los recursos que usaste en esta página.

Borra Spaces

Para limpiar Spaces, debes borrar los recursos del modelo y los recursos de la aplicación de muestra en Cloud Run.

Borra los recursos del modelo

Desde la app de Gradio, puedes borrar los extremos del modelo para limpiar los recursos de Vertex AI. Luego, debes borrar el servicio de Cloud Run para detener y borrar la app de Gradio.

Para borrar manualmente los recursos de Vertex AI, consulta Anula la implementación de modelos y borra recursos.

Borra el servicio de Cloud Run

Borra los recursos relacionados con un servicio, incluidas todas las revisiones del servicio. Borrar un servicio no incluye elementos como imágenes de contenedor de Artifact Registry. Para obtener más información, consulta Administración de servicios en la documentación de Cloud Run.

  1. En la Google Cloud consola, consulta la lista de servicios de Cloud Run:

    Ir a Cloud Run

  2. Busca el servicio que deseas borrar y, luego, selecciónalo.

  3. Haz clic en delete Borrar. Esta acción borra todas las revisiones del servicio

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que tú quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

¿Qué sigue?

Consulta una descripción general de Model Garden.