Usar reservas com instâncias do Workbench da Agent Platform
Este documento explica como usar as reservas do Compute Engine para garantir que as instâncias do Workbench da Agent Platform do Gemini Enterprise tenham recursos de máquina virtual (VM) suficientes para execução.
As reservas são um recurso do Compute Engine. Elas ajudam a garantir que você tenha os recursos disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar.
Ao criar uma reserva, o Compute Engine verifica se a capacidade solicitada está disponível na zona especificada. Em caso afirmativo, o Compute Engine reserva os recursos, cria a reserva e o seguinte acontece:
Os recursos reservados ficam imediatamente disponíveis para consumo e permanecem disponíveis até que você exclua a reserva.
Você é cobrado pelos recursos reservados na mesma taxa sob demanda que as VMs em execução, incluindo todos os descontos aplicáveis, até que a reserva seja excluída. Ao consumir uma reserva, uma VM não gera cobranças duplicadas de recursos, já que a reserva já é cobrada pelo custo dos recursos reservados. Para saber mais, consulte Reservas para recursos zonais do Compute Engine .
Limitações e requisitos
Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Workbench da Agent Platform consomem reservas. Saiba Como funcionam as reservas.
Além disso, ao usar reservas com instâncias do Workbench da Agent Platform, as seguintes limitações e requisitos se aplicam:
Sua reserva precisa ser uma das seguintes:
- No mesmo projeto que a instância do Workbench da Agent Platform.
- Compartilhada com o mesmo projeto que a instância do Workbench da Agent Platform.
As propriedades de VM de uma reserva precisam corresponder exatamente à instância do Workbench da Agent Platform para consumir a reserva. Por exemplo, se uma reserva especificar um tipo de máquina
e2-standard-8, a instância do Workbench da Agent Platform só poderá consumir a reserva se também usar um tipo de máquinae2-standard-8. Consulte Requisitos.
Antes de começar
- Revise os requisitos e restrições de reservas.
- Revise os requisitos de cota e as restrições para reservas compartilhadas.
- Faça login na sua Google Cloud conta do. Se você não conhece o Google Cloud, crie uma conta para avaliar o desempenho dos nossos produtos em cenários reais. Clientes novos também recebem US $300 em créditos para executar, testar e implantar cargas de trabalho.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Funções exigidas
Para receber as permissões necessárias para usar reservas com instâncias do Workbench da Agent Platform, peça ao administrador para conceder a você as seguintes funções do IAM no projeto:
- Administrador do Compute (
roles/compute.admin) - Administrador de notebooks (
roles/notebooks.admin)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Criar uma reserva
Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. A reserva pode ser sob demanda ou uma reserva adiantada. Para mais informações, consulte Escolher um tipo de reserva.
Usar uma reserva com uma nova instância
Para criar uma instância do Workbench da Agent Platform que consuma uma reserva, use o Google Cloud console ou a API REST.
Console
Para criar uma instância do Workbench da Agent Platform que consuma uma reserva, faça o seguinte:
No Google Cloud console, acesse a página Instâncias.
Clique em Criar.
Na caixa de diálogo Nova instância, clique em Opções avançadas.
Na caixa de diálogo Criar instância, na seção Tipo de máquina , selecione o tipo de máquina e a configuração de GPU que correspondem à sua reserva.
Em Plataforma de CPU e GPU, no menu Reservas, selecione a reserva a ser consumida.
Clique em Criar.
O Workbench da Agent Platform cria uma instância e a inicia automaticamente. Quando a instância estiver pronta para uso, o Workbench da Agent Platform vai ativar um link Abrir JupyterLab.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
PROJECT_ID: ID do projeto;LOCATION: a zona em que a instância está localizadaINSTANCE_NAME: o nome da instânciaMACHINE_TYPE: o tipo de máquina da instânciaRESERVATION_TYPE: o tipo de reserva. Precisa serRESERVATION_ANYouRESERVATION_SPECIFICRESERVATION_NAME: o nome da reserva ao usar oRESERVATION_SPECIFICtipo- Para reservas no mesmo projeto, é possível usar o ID da reserva.
- Para reservas em um projeto diferente, é necessário usar o caminho completo da reserva. Por
exemplo:
projects/PROJECT_ID/reservations/RESERVATION_NAME.
Método HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON da solicitação:
{
"gce_setup": {
"machine_type": "MACHINE_TYPE",
"reservation_affinity": {
"consume_reservation_type": "RESERVATION_TYPE",
"key": "compute.googleapis.com/reservation-name",
"values": ["RESERVATION_NAME"]
}
}
}
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Para mais informações, consulte a documentação da API REST projects.locations.instances.create.
Parar de usar sua reserva
Para deixar de usar sua reserva, você pode excluir sua reserva.
Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Workbench da Agent Platform a utilize, exclua a instância.
Faturamento
Ao consumir uma reserva do Compute Engine, você é cobrado pelo seguinte:
Os recursos do Compute Engine, incluindo todos os descontos por uso contínuo (CUDs) aplicáveis, nos preços do Compute Engine. Essas cobranças têm o rótulo
goog-vertex-ai-product: workbench-instancesna SKU. Consulte Preços do Compute Engine.Taxas de gerenciamento do Workbench da Agent Platform, além do uso da infraestrutura. Consulte Preços do Workbench da Agent Platform.
Resolver problemas
Para encontrar métodos para diagnosticar e resolver erros relacionados ao uso de reservas com instâncias do Workbench da Agent Platform, consulte Solução de problemas de instâncias do Workbench da Agent Platform.
A seguir
- Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.