Testar recursos do modelo no Model Garden

O Model Garden oferece várias opções para você conferir e testar rapidamente os recursos do modelo. Para modelos compatíveis, você pode testar playgrounds de demonstração ou iniciar aplicativos de demonstração chamados Model Garden Spaces, que podem ser compartilhados com outras pessoas para mostrar os recursos de um modelo.

Os playgrounds são alimentados por endpoints de previsão on-line da Gemini Enterprise Agent Platform pré-implantados e não geram cobranças. Ao abrir o card de modelo de um modelo compatível, você pode usar o painel Testar para testar rapidamente os recursos do modelo enviando um comando de texto. Também é possível definir alguns dos parâmetros mais comuns, como temperatura e número de tokens de saída. O playground é limitado apenas a entradas e saídas de texto.

Ao iniciar o Spaces, você tem um aplicativo da Web funcional pronto para uso com muito menos esforço manual do que implantar um modelo e criar um app para usar o endpoint do modelo. O Model Garden implanta o modelo selecionado na Gemini Enterprise Agent Platform e o app de exemplo em uma instância do Cloud Run que usa o endpoint do modelo implantado. O aplicativo também pode usar endpoints atuais ou um endpoint MaaS.

Antes de começar

Este tutorial exige que você configure um Google Cloud projeto e ative a API Agent Platform.

  1. Faça login na sua Google Cloud conta do. Se você começou a usar o Google Cloud, crie uma conta para avaliar o desempenho dos nossos produtos em situações reais. Clientes novos também recebem US $300 em créditos para executar, testar e implantar cargas de trabalho.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  10. Se você quiser testar o Model Garden Spaces, então verifique se a conta de serviço padrão do Compute Engine tem as permissões necessárias para iniciar o Spaces.

Funções exigidas

Para testar os recursos do modelo no Model Garden, verifique se você e a conta de serviço padrão do Compute Engine têm as funções do IAM necessárias.

Funções necessárias para usuários

Para receber as permissões necessárias para testar os recursos do modelo no Model Garden, peça ao administrador para conceder a você as seguintes funções do IAM no seu Google Cloud projeto:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Também é possível conseguir as permissões necessárias usando personalizados papéis ou outros predefinidos papéis.

Funções necessárias para a conta de serviço padrão do Compute Engine

A conta de serviço padrão do Compute Engine é usada para iniciar o Spaces.

Para garantir que a conta de serviço padrão do Compute Engine tenha as permissões necessárias para iniciar o Spaces, peça ao administrador para conceder as seguintes funções do IAM à conta de serviço padrão do Compute Engine no seu Google Cloud projeto:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

O administrador também pode conceder à conta de serviço padrão do Compute Engine as permissões necessárias por meio de papéis personalizados ou outros papéis predefinidos.

Testar um playground

  1. No Google Cloud console, acesse o card de modelo de um modelo compatível, como o card de modelo do Gemma 2.

    Acessar o Gemma 2

  2. No painel Testar:

    1. Em Região, aceite o padrão ou escolha sua região.
    2. Em Endpoint, selecione Playground de demonstração.
    3. Na caixa Comando, digite Why is the sky blue?.
    4. Expanda a seção Opções avançadas e confira os parâmetros padrão.

    O painel de teste do Gemma 2b-it

  3. Clique em Enviar. A saída aparece abaixo do botão "Enviar".

Testar o Spaces

Para iniciar um modelo, abra o card de modelo do modelo compatível e, no painel Testar o Spaces, clique em um espaço para iniciar um. Você recebe cobranças pelas máquinas usadas na implantação e pela instância do Cloud Run que hospeda o app.

É possível iniciar o Spaces com modelos como Gemini, Gemma, Llama e Stable Diffusion.

Iniciar o Spaces

Inicie o Spaces para testar e experimentar um modelo de um aplicativo de exemplo do Gradio.

  1. No Google Cloud console, acesse o Model Garden para conferir o card de modelo de um modelo.

    Acessar o Model Garden

  2. Selecione o modelo a ser usado. Os modelos compatíveis têm um painel Testar o Spaces, como o card de modelo do Gemma 3.

    Acessar o Gemma 3

  3. Clique em rocket_launch Executar para iniciar um espaço.

    1. Você pode escolher Exigir autenticação (via Identity Aware Proxy) ou Permitir acesso público. Para mais informações, consulte Ativar APIs para a primeira implantação e conceder permissões.
    1. Clique em Criar novo serviço para iniciar a implantação. É possível monitorar o status da implantação no card de modelo.
  4. Depois que o status do Spaces mudar para Pronto, clique nele para conferir detalhes sobre a implantação.

    Para proteção básica, o aplicativo da Web exige uma chave secreta que precisa ser anexada ao URL ao enviar comandos. Essa chave secreta é fornecida no campo Chave secreta.

    1. Clique em Abrir para começar a usar o app. É possível enviar comandos ao modelo e conferir as respostas dele no app.

    Você pode compartilhar o URL para que outras pessoas também possam testar o app.

    1. Para fechar o acesso ao app, clique em Editar no campo Controle de acesso.

    Na guia Segurança do aplicativo do Cloud Run, selecione Exigir autenticação e clique em Salvar. O aplicativo não está mais disponível pelo URL. As visitas ao URL resultam em um erro 403 (proibido).

Limpar

Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.

Excluir espaços

Para limpar o Spaces, é necessário excluir os recursos do modelo e os recursos do aplicativo de exemplo no Cloud Run.

Excluir recursos do modelo

No app Gradio, é possível excluir endpoints de modelo para limpar os recursos da Gemini Enterprise Agent Platform. Em seguida, é necessário excluir o serviço do Cloud Run para interromper e excluir o app Gradio.

Para excluir manualmente os recursos da Gemini Enterprise Agent Platform, consulte Cancelar a implantação de modelos e excluir recursos.

Excluir serviço do Cloud Run

Exclua os recursos relacionados a um serviço, incluindo todas as revisões do serviço. A exclusão de um serviço não inclui itens como imagens de contêiner do Artifact Registry. Para mais informações, consulte Gerenciar serviços na documentação do Cloud Run.

  1. No Google Cloud console, confira a lista de serviços do Cloud Run:

    Acessar o Cloud Run

  2. Localize o serviço a ser excluído e selecione-o.

  3. Clique em delete Excluir. Isso excluirá todas as revisões do serviço.

Excluir o projeto

O jeito mais fácil de evitar cobranças é excluindo o projeto que você criou para o tutorial.

Para excluir o projeto:

  1. No Google Cloud console, acesse a página Gerenciar recursos.

    Acessar "Gerenciar recursos"

  2. Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir.
  3. Na caixa de diálogo, digite o ID do projeto e clique em Desligar para excluir o projeto.

A seguir

Confira uma visão geral do Model Garden.