Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Solução de problemas do Workbench do Agent Platform

Nesta página, descrevemos as etapas de solução de problemas que podem ser úteis se você tiver problemas ao usar o Gemini Enterprise Agent Platform Workbench.

Consulte também Solução de problemas da Agent Platform para receber ajuda ao usar outros componentes da Gemini Enterprise Agent Platform.

Para filtrar o conteúdo desta página, clique em um tópico:

Instâncias do Workbench do Agent Platform

Nesta seção, descrevemos as etapas de solução de problemas para instâncias do Agent Platform Workbench.

Solução de problemas com ferramentas de IA

Esta seção discute como usar ferramentas de IA para solução de problemas;

Solução de problemas com as investigações do Cloud Assist

Ao conectar a Agent Platform a outros Google Cloud produtos, talvez você ache as investigações do Gemini Cloud Assist úteis para resolver problemas de integração. Elas também podem acelerar a solução de problemas na própria instância. O Gemini Cloud Assist permite extrair insights de métricas e registros gerados pela instância.

Pare a instância e siga o link View in Compute Engine.
Instale o Agente de operações (recomendado). Isso vai levar alguns minutos
Adicione um campo notebook-enable-debug de Metadados personalizados e defina como true.
Reinicie a instância e reproduza o problema.
Ative e configure a API Cloud Assist Investigations.
Crie uma nova investigação e descreva o problema em detalhes usando um comando de linguagem natural.
À medida que você digita, uma caixa de diálogo aparece sugerindo recursos para adicionar à investigação. Revise essa lista e adicione a instância como um recurso, bem como outros recursos na lista de produtos compatíveis.
Inicie a investigação e analise os resultados.

Resolver problemas com arquivos de diagnóstico usando a CLI do Gemini

Você pode usar os resultados da investigação do Cloud Assist para informar outras investigações baseadas em IA no arquivo de diagnóstico da instância.

Execute a ferramenta de diagnóstico e especifique um bucket do Cloud Storage para fazer upload dos resultados.

sudo /opt/deeplearning/bin/diagnostic_tool.sh [--repair] [--bucket=$BUCKET]

Faça o download do arquivo de diagnóstico para sua estação de trabalho e instale e configure a CLI do Gemini.
Inicie o aplicativo e descreva o problema. Inclua a hipótese da investigação do Cloud Assist no contexto. Peça ao modelo para estender a investigação lendo o conteúdo do arquivo de diagnóstico usando comandos em linguagem natural.

Como se conectar e abrir o JupyterLab

Nesta seção, descrevemos as etapas de solução de problemas para se conectar e abrir o JupyterLab.

Nada acontece após clicar em Abrir JupyterLab

Problema

Quando você clica em Abrir JupyterLab, nada acontece.

Solução

Verifique se o navegador não impede que novas guias sejam abertas automaticamente. O JupyterLab é aberto em uma nova guia do navegador.

Não é possível acessar o terminal em uma instância do Agent Platform Workbench

Problema

Se você não conseguir acessar o terminal ou encontrar a janela do terminal na tela de início, isso pode ser porque a instância do Agent Platform Workbench não tem o acesso ao terminal ativado.

Solução

Crie uma nova instância do Agent Platform Workbench com a opção Acesso de terminal ativada. Essa opção não pode ser alterada após a criação da instância.

Erro 502 ao abrir o JupyterLab

Problema

Um erro 502 pode significar que sua instância do Agent Platform Workbench ainda não está pronta.

Solução

Aguarde alguns minutos, atualize a guia do navegador do console Google Cloud e tente de novo.

O notebook não responde

Problema

Sua instância do Agent Platform Workbench não está executando células ou parece estar congelada.

Solução

Primeiro, tente reiniciar o kernel clicando em Kernel no menu superior e depois em Reiniciar kernel. Se isso não funcionar, tente o seguinte:

Atualize a página do navegador JupyterLab. A saída da célula não salva não persiste. Portanto, execute essas células novamente para gerar a saída novamente.
Redefina a instância.

Não foi possível se conectar à instância do Agent Platform Workbench usando SSH

Problema

Não é possível se conectar à sua instância usando SSH em uma janela de terminal.

As instâncias do Workbench do Agent Platform usam o Login do SO para permitir o acesso SSH. Quando você cria uma instância, o Agent Platform Workbench ativa o login do SO por padrão, definindo a chave de metadados enable-oslogin como TRUE. Se não for possível usar o SSH para se conectar à instância, talvez essa chave de metadados precise ser definida como TRUE.

Solução

Não há suporte para conexão com uma instância do Agent Platform Workbench usando o console Google Cloud . Se você não conseguir se conectar à sua instância usando SSH em uma janela de terminal, consulte:

Para definir a chave de metadados enable-oslogin como TRUE, use o método projects.locations.instances.patch na API Notebooks ou o comando gcloud workbench instances update no SDK da Agent Platform.

A cota de GPU foi excedida

Problema

Não é possível criar uma instância do Workbench da Plataforma de Agentes com GPUs.

Solução

Consulte a página de cotas para saber o número de GPUs disponíveis no seu projeto. Se as GPUs não estiverem listadas nessa página ou se você precisar de mais cotas, solicite um aumento para as GPUs do Compute Engine. Consulte Solicitar um limite de cota maior.

Como criar instâncias do Workbench do Agent Platform

Esta seção descreve como solucionar problemas relacionados à criação de instâncias do Agent Platform Workbench.

A instância permanece no estado pendente indefinidamente ou fica presa no status de provisionamento

Problema

Depois de criar uma instância do Agent Platform Workbench, ela permanece no estado pendente indefinidamente. Um erro como este pode aparecer nos registros seriais:

Could not resolve host: notebooks.googleapis.com

Se a instância fica presa no status de provisionamento, isso pode ser porque você tem uma configuração de rede particular inválida para ela.

Solução

Siga as etapas na seção Os registros da instância mostram erros de conexão ou de tempo limite.

Não é possível criar uma instância dentro de uma rede VPC compartilhada

Problema

A tentativa de criar uma instância em uma rede VPC compartilhada resulta em uma mensagem de erro como esta:

Required 'compute.subnetworks.use' permission for
'projects/network-administration/regions/us-central1/subnetworks/v'

Solução

O problema é que a conta de serviço de notebooks está tentando criar a instância sem as permissões corretas.

Para garantir que a conta de serviço dos notebooks tenha as permissões necessárias para criar uma instância do Agent Platform Workbench em uma rede VPC compartilhada, peça ao administrador para conceder à conta de serviço dos notebooks o papel de usuário da rede de computação (roles/compute.networkUser) do IAM no projeto host.

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para garantir que a conta de serviço do Notebooks possa criar uma instância do Agent Platform Workbench em uma rede VPC compartilhada. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As permissões a seguir são necessárias para garantir que a conta de serviço do Notebooks possa criar uma instância do Agent Platform Workbench em uma rede VPC compartilhada:

Para usar sub-redes: compute.subnetworks.use

O administrador também pode conceder essas permissões à conta de serviço de notebooks com papéis personalizados ou outros papéis predefinidos.

Não é possível criar uma instância do Workbench da Agent Platform com um contêiner personalizado

Problema

Não há opção para usar um contêiner personalizado ao criar uma instância do Workbench da Agent Platform no Google Cloud console.

Solução

Não é possível adicionar um contêiner personalizado a uma instância do Workbench da Agent Platform usando o console Google Cloud .

Adicionar um ambiente conda é recomendado em vez de usar um contêiner personalizado.

É possível adicionar um contêiner personalizado a uma instância do Workbench da Agent Platform usando a API Notebooks, mas esse recurso não é compatível.

Não é possível usar a CLI do Gemini

Problema

O bloco da CLI do Gemini está no iniciador do JupyterLab e abre sem problemas, mas o Gemini não responde aos comandos.

Solução

Um administrador pode ter bloqueado o acesso à CLI do Gemini. Consulte Controlar o acesso à CLI do Gemini.

O botão "Ativar armazenamento compartilhado" não aparece

Problema

O botão Montar armazenamento compartilhado não aparece na guia Navegador de arquivos da interface do JupyterLab.

Solução

A permissão storage.buckets.list é necessária para que o botão Montar armazenamento compartilhado apareça na interface do JupyterLab da sua instância do Workbench da Agent Platform. Peça ao administrador para conceder à conta de serviço da instância do Agent Platform Workbench a permissão storage.buckets.list no projeto.

Erro 599 ao usar o Serviço Gerenciado para Apache Spark

Problema

A tentativa de criar uma instância ativada para o Serviço Gerenciado para Apache Spark resulta em uma mensagem de erro como esta:

HTTP 599: Unknown (Error from Gateway: [Timeout while connecting]
Exception while attempting to connect to Gateway server url.
Ensure gateway url is valid and the Gateway instance is running.)

Solução

Na configuração do Cloud DNS, adicione uma entrada do Cloud DNS para o domínio *.googleusercontent.com.

Não foi possível instalar a extensão JupyterLab de terceiros

Problema

A tentativa de instalar uma extensão JupyterLab de terceiros resulta em uma mensagem Error: 500.

Solução

As extensões do JupyterLab de terceiros não são compatíveis com instâncias do Workbench da Agent Platform.

Não é possível editar a máquina virtual subjacente

Problema

Ao tentar editar a máquina virtual (VM) subjacente de uma instância do Agent Platform Workbench, é possível que você receba uma mensagem de erro semelhante a esta:

Current principal doesn't have permission to mutate this resource.

Solução

Esse erro ocorre porque não é possível editar a VM subjacente de uma instância usando o console Google Cloud ou a API Compute Engine.

Para editar a VM subjacente de uma instância do Agent Platform Workbench, use o método projects.locations.instances.patch na API Notebooks ou o comando gcloud workbench instances update no SDK da plataforma do agente.

pacotes `pip` não ficam disponíveis após a adição do ambiente conda

Problema

Seus pacotes pip não ficam disponíveis depois que você adiciona um kernel baseado em conda.

Solução

Para resolver o problema, consulte Adicionar um ambiente conda e tente o seguinte:

Verifique se você usou a variável DL_ANACONDA_ENV_HOME e se ela contém o nome do ambiente.
Verifique se pip está localizado em um caminho semelhante a opt/conda/envs/ENVIRONMENT/bin/pip. Execute o comando which pip para indicar o caminho.

Não é possível acessar ou copiar dados de uma instância com acesso de usuário único

Problema

Os dados em uma instância com acesso de usuário único ficam inacessíveis.

Para instâncias do Workbench da Agent Platform configuradas com acesso de um único usuário, apenas o único usuário especificado (o proprietário) pode acessar os dados na instância.

Solução

Para acessar ou copiar os dados quando você não é o proprietário da instância, abra um caso de suporte.

Desligamento inesperado

Problema

Sua instância do Agent Platform Workbench é encerrada inesperadamente.

Solução

Se a instância for encerrada inesperadamente, pode ser que o desligamento inativo tenha sido iniciado.

Se você ativou o encerramento inativo, a instância será encerrada quando não houver atividade do kernel para o período especificado. Por exemplo, executar uma célula ou nova impressão de saída em um notebook é a atividade que redefine o timer de tempo limite de inatividade. O uso da CPU não redefine o timer de tempo limite de inatividade.

Os registros da instância mostram erros de conexão ou de tempo limite

Problema

Os registros da instância do Agent Platform Workbench mostram erros de conexão ou de tempo limite.

Solução

Se você notar erros de conexão ou de tempo limite nos registros da instância, verifique se o servidor Jupyter está em execução na porta 8080. Siga as etapas na seção Verificar se a API interna do Jupyter está ativa.

Se você desativou External IP e está usando uma rede VPC particular, siga a documentação de opções de configuração de rede. Considere o seguinte:

Ative o acesso privado do Google na sub-rede escolhida na mesma região em que a instância está no projeto host da VPC. Para mais informações sobre como configurar o acesso privado do Google, consulte a documentação do acesso privado do Google.
Ao usar o Cloud DNS, a instância precisa resolver os domínios do Cloud DNS necessários especificados na documentação de opções de configuração de rede. Para verificar isso, siga as etapas na seção Verificar se a instância pode resolver os domínios DNS necessários.

Os registros da instância mostram "Não é possível entrar em contato com a API Jupyter: ReadTimeoutError".

Problema

Os registros da instância do Agent Platform Workbench mostram um erro, como:

notebooks_collection_agent. Unable to contact Jupyter API:
HTTPConnectionPool(host=\'127.0.0.1\', port=8080):
Max retries exceeded ReadTimeoutError(\"HTTPConnectionPool(host=\'127.0.0.1\', port=8080

Solução

Siga as etapas na seção Os registros da instância mostram erros de conexão ou de tempo limite. Você também pode tentar modificar o script do agente de coleta de notebooks para mudar HTTP_TIMEOUT_SESSION para um valor maior, como 60, o que pode ajudar a verificar se a solicitação falhou devido a uma chamada que demorou muito para responder ou à impossibilidade de acessar o URL solicitado.

O endereço `docker0` entra em conflito com o endereçamento da VPC

Problema

Por padrão, a interface docker0 é criada com um endereço IP de 172.17.0.1/16. Isso pode entrar em conflito com o endereçamento IP na sua rede VPC, impedindo que a instância se conecte a outros endpoints com endereços 172.17.0.1/16.

Solução

É possível forçar a criação da interface docker0 com um endereço IP que não entre em conflito com sua rede VPC usando o seguinte script de pós-inicialização e definindo o comportamento do script de pós-inicialização como run_once.

#!/bin/bash
# Wait for Docker to be fully started
while ! systemctl is-active docker; do
sleep 1
done
# Stop the Docker service
systemctl stop docker
# Modify /etc/docker/daemon.json
cat < /etc/docker/daemon.json
{
"bip": "CUSTOM_DOCKER_IP/16"
}
EOF
# Restart the Docker service
systemctl start docker

As reservas especificadas não existem

Problema

A operação para criar a instância resulta em uma mensagem de erro Specified reservations do not exist. A saída da operação pode ser semelhante a esta:

{
  "name": "projects/PROJECT/locations/LOCATION/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.notebooks.v2.OperationMetadata",
    "createTime": "2025-01-01T01:00:01.000000000Z",
    "endTime": "2025-01-01T01:00:01.000000000Z",
    "target": "projects/PROJECT/locations/LOCATION/instances/INSTANCE_NAME",
    "verb": "create",
    "requestedCancellation": false,
    "apiVersion": "v2",
    "endpoint": "CreateInstance"
  },
  "done": true,
  "error": {
    "code": 3,
    "message": "Invalid value for field 'resource.reservationAffinity': '{  \"consumeReservationType\": \"SPECIFIC_ALLOCATION\",  \"key\": \"compute.googleapis.com/reservation-name...'. Specified reservations [projects/PROJECT/zones/ZONE/futureReservations/RESERVATION_NAME] do not exist.",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.RequestInfo",
        "requestId": "REQUEST_ID"
      }
    ]
  }
}

Solução

Alguns tipos de máquina do Compute Engine exigem parâmetros adicionais na criação, como SSDs locais ou uma plataforma de CPU mínima. A especificação da instância precisa incluir esses campos extras.

As instâncias do Workbench do Agent Platform usam a plataforma mínima de CPU automática por padrão. Se a reserva definir uma plataforma específica, você precisará definir min_cpu_platform de acordo ao criar instâncias do Workbench do Agent Platform.
As instâncias do Agent Platform Workbench sempre definem o número de SSDs locais para os valores padrão de acordo com o tipo de máquina. Por exemplo, a2-ultragpu-1g sempre tem um SSD local, enquanto a2-highgpu-1g sempre tem zero. Ao criar reservas para serem usadas em instâncias do Agent Platform Workbench, deixe o SSD local com o valor padrão.

Procedimentos úteis

Esta seção descreve procedimentos que podem ser úteis.

Use SSH para se conectar à instância do Agent Platform Workbench

Use o SSH para se conectar à instância digitando o seguinte comando no Cloud Shell ou em qualquer ambiente em que a Google Cloud CLI esteja instalada.

gcloud compute ssh --project PROJECT_ID \
  --zone ZONE \
  INSTANCE_NAME -- -L 8080:localhost:8080

Substitua:

PROJECT_ID: o ID do projeto
ZONE: a Google Cloud zona em que a instância está localizada
INSTANCE_NAME: o nome da instância

Também é possível conectar-se à instância abrindo a página de detalhes do Compute Engine dela e clicando no botão SSH.

Registrar novamente com o servidor Inverting Proxy

Para registrar novamente a instância do Workbench da Agent Platform com o servidor Inverting Proxy interno, interrompa e inicie a VM na página "Instâncias" ou use SSH para se conectar à instância do Workbench da Agent Platform e digite:

cd /opt/deeplearning/bin
sudo ./attempt-register-vm-on-proxy.sh

Verificar o status do serviço do Docker

Para verificar o status do serviço Docker, use ssh para se conectar à sua instância do Agent Platform Workbench e digite:

sudo service docker status

Verifique se o agente do Inverting Proxy está em execução

Para verificar se o agente Inverting Proxy do notebook está em execução, use SSH para se conectar à instância do Agent Platform Workbench e digite:

# Confirm Inverting Proxy agent Docker container is running (proxy-agent)
sudo docker ps

# Verify State.Status is running and State.Running is true.
sudo docker inspect proxy-agent

# Grab logs
sudo docker logs proxy-agent

Verifique o status do serviço Jupyter e colete os registros

Para verificar o status do serviço Jupyter, use ssh para se conectar à instância do Agent Platform Workbench e digite:

sudo service jupyter status

Para coletar os registros do serviço Jupyter:

sudo journalctl -u jupyter.service --no-pager

Verificar se a API interna do Jupyter está ativa

A API Jupyter precisa ser executada sempre na porta 8080. Para verificar se isso está acontecendo, inspecione os syslogs da instância em busca de uma entrada semelhante a esta:

Jupyter Server ... running at:
http://localhost:8080

Para verificar se a API interna do Jupyter está ativa, use SSH para se conectar à instância do Agent Platform Workbench e digite:

curl http://127.0.0.1:8080/api/kernelspecs

Também é possível medir o tempo que a API leva para responder, caso as solicitações estejam demorando muito:

time curl -V http://127.0.0.1:8080/api/status
time curl -V http://127.0.0.1:8080/api/kernels
time curl -V http://127.0.0.1:8080/api/connections

Para executar esses comandos na instância do Agent Platform Workbench, abra o JupyterLab e crie um terminal.

Reinicie o serviço do Docker

Para reiniciar o serviço Docker, interrompa e inicie a VM na página "Instâncias" ou use o SSH para se conectar à instância do Agent Platform Workbench e digite:

sudo service docker restart

Reiniciar o agente do Inverting Proxy

Para reiniciar o agente Inverting Proxy, interrompa e inicie a VM na página "Instâncias" ou use SSH para se conectar à instância do Agent Platform Workbench e digite:

sudo docker restart proxy-agent

Reiniciar o serviço Jupyter

Para reiniciar o serviço Jupyter, interrompa e inicie a VM na página "Instâncias" ou use SSH para se conectar à instância do Agent Platform Workbench e digite:

sudo service jupyter restart

Reiniciar o agente de coleta de notebooks

O serviço do agente de coleta de notebooks executa um processo Python em segundo plano que verifica o status dos principais serviços da instância do Agent Platform Workbench.

Para reiniciar o serviço do agente de coleta de notebooks, interrompa e inicie a VM no console doGoogle Cloud ou use SSH para se conectar à instância do Agent Platform Workbench e digite:

sudo systemctl stop notebooks-collection-agent.service

seguido por:

sudo systemctl start notebooks-collection-agent.service

Para executar esses comandos na instância do Agent Platform Workbench, abra o JupyterLab e crie um terminal.

Modificar o script do agente de coleta de notebooks

Para acessar e editar o script, abra um terminal na instância ou use SSH para se conectar à instância do Workbench da Agent Platform, e digite:

nano /opt/deeplearning/bin/notebooks_collection_agent.py

Depois de editar o arquivo, salve-o.

Em seguida, reinicie o serviço do agente de coleta de notebooks.

Verificar se a instância pode resolver os domínios DNS necessários

Para verificar se a instância pode resolver os domínios DNS necessários, use SSH para se conectar à instância do Agent Platform Workbench e digite:

host notebooks.googleapis.com
host *.notebooks.cloud.google.com
host *.notebooks.googleusercontent.com
host *.kernels.googleusercontent.com

curl --silent --output /dev/null "https://notebooks.cloud.google.com"; echo $?

Se a instância tiver o Serviço Gerenciado para Apache Spark ativado, você poderá verificar se ela resolve *.kernels.googleusercontent.com executando o seguinte:

curl --verbose -H "Authorization: Bearer $(gcloud auth print-access-token)" https://${PROJECT_NUMBER}-dot-${REGION}.kernels.googleusercontent.com/api/kernelspecs | jq .

Para executar esses comandos na instância do Agent Platform Workbench, abra o JupyterLab e crie um terminal.

Fazer uma cópia dos dados do usuário em uma instância

Para armazenar uma cópia dos dados do usuário da sua instância no Cloud Storage, conclua as etapas a seguir.

Criar um bucket do Cloud Storage (opcional)

No mesmo projeto em que sua instância está localizada, crie um bucket do Cloud Storage para armazenar os dados do usuário. Caso você já tenha um bucket do Cloud Storage, pule esta etapa.

Crie um bucket do Cloud Storage:
```
gcloud storage buckets create gs://BUCKET_NAME
```
Substitua BUCKET_NAME por um nome de bucket que atenda aos requisitos de nomenclatura de bucket.

Copiar dados do usuário

Na interface da instância do JupyterLab, selecione File > New > Terminal para abrir uma janela de terminal. Para instâncias do Workbench da Agent Platform, é possível se conectar ao terminal da instância usando SSH.
Use a CLI gcloud para copiar os dados do usuário para um bucket do Cloud Storage. O exemplo de comando a seguir copia todos os arquivos do diretório /home/jupyter/ da instância para um diretório em um bucket do Cloud Storage.
```
gcloud storage cp /home/jupyter/* gs://BUCKET_NAMEPATH --recursive
```
Substitua:
- BUCKET_NAME: o nome do bucket do Cloud Storage
- PATH: o caminho para o diretório em que você quer copiar os arquivos, por exemplo: /copy/jupyter/

Investigar uma instância que está com problemas de provisionamento usando o gcpdiag

gcpdiag é uma ferramenta de código aberto. Não é um produto Google Cloud com suporte oficial. Use a ferramenta gcpdiag para identificar e corrigir problemas no projeto Google Cloud. Para mais informações, consulte o projeto gcpdiag no GitHub.

Este runbook gcpdiag investiga as possíveis causas de uma instância do Workbench da Agent Platform ficar presa no status de provisionamento, incluindo as seguintes áreas:

Status: verifica o status atual da instância para confirmar se ela está travada no provisionamento e não interrompida ou ativa.
Imagem de disco de inicialização da VM do Compute Engine da instância: verifica se a instância foi criada com um contêiner personalizado, uma imagem workbench-instances oficial, Deep Learning VM Images ou imagens sem suporte que podem causar o travamento dela no status de provisionamento.
Scripts personalizados: verifica se a instância está usando scripts personalizados de inicialização ou pós-inicialização que mudam a porta padrão do Jupyter ou quebram dependências que podem fazer com que a instância fique presa no status de provisionamento.
Versão do ambiente: verifica se a instância está usando a versão mais recente do ambiente, verificando a capacidade de upgrade dela. Versões anteriores podem fazer com que a instância fique presa no status de provisionamento.
Desempenho da VM do Compute Engine da instância: verifica o desempenho atual da VM para garantir que ela não esteja prejudicada pelo uso de CPU alto, por memória insuficiente ou por problemas de espaço em disco que possam interromper as operações normais.
Porta serial do Compute Engine ou geração de registros do sistema da instância: verifica se a instância tem registros de porta serial, que são analisados para garantir que o Jupyter esteja em execução na porta 127.0.0.1:8080.
Acesso SSH e de terminal do Compute Engine da instância: verifica se a VM do Compute Engine da instância está em execução para que o usuário possa usar SSH e abrir um terminal para verificar se o uso de espaço em home/jupyter é inferior a 85%. Quando não há espaço, a instância pode ficar presa no status de provisionamento.
IP externo desativado: verifica se o acesso a IPs externos está desativado. Uma configuração de rede incorreta pode fazer com que a instância fique presa no status de provisionamento.

Docker

Você pode executar gcpdiag usando um wrapper que inicia gcpdiag em um contêiner do Docker. Docker ou Podman precisa ser instalado.

Copie e execute o seguinte comando na estação de trabalho local.
```
curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
```

Execute o comando gcpdiag.

./gcpdiag runbook vertex/workbench-instance-stuck-in-provisioning \
    --parameter project_id=PROJECT_ID \
    --parameter instance_name=INSTANCE_NAME \
    --parameter zone=ZONE

Veja os parâmetros disponíveis para este runbook.

Substitua:

PROJECT_ID: o ID do projeto que contém o recurso.
INSTANCE_NAME: o nome da instância de destino do Agent Platform Workbench no projeto.
ZONE: a zona em que a instância de destino do Agent Platform Workbench está.

Flags úteis

--universe-domain: se aplicável, a Nuvem soberana de parceiro confiável que hospeda o recurso
--parameter ou -p: parâmetros do runbook

Para conferir uma lista e descrição de todas as flags da ferramenta gcpdiag, consulte Instruções de uso do gcpdiag.

Erros de permissões ao usar papéis de conta de serviço com a Agent Platform

Problema

Você recebe erros gerais de permissão ao usar papéis de conta de serviço com a Agent Platform.

Esses erros podem aparecer no Cloud Logging nos registros de componentes do produto ou de auditoria. Eles também podem aparecer em qualquer combinação dos projetos afetados.

Esses problemas podem ser causados por um ou ambos os motivos a seguir:

Uso do papel Service Account Token Creator quando o papel Service Account User deveria ter sido usado ou vice-versa. Esses papéis concedem permissões diferentes em uma conta de serviço e não são intercambiáveis. Para saber mais sobre as diferenças entre os papéis Service Account Token Creator e Service Account User, consulte Papéis da conta de serviço.
Você concedeu permissões de uma conta de serviço em vários projetos, o que não é permitido por padrão.

Solução

Para resolver o problema, tente uma ou mais das seguintes opções:

Determine se o papel Service Account Token Creator ou Service Account User é necessário. Para saber mais, leia a documentação do IAM para os serviços da Agent Platform que você está usando, bem como outras integrações de produtos.
Se você tiver concedido permissões a uma conta de serviço em vários projetos, ative a vinculação de contas de serviço entre projetos verificando se iam.disableCrossProjectServiceAccountUsage. não é aplicada. Para garantir que iam.disableCrossProjectServiceAccountUsage não seja aplicado, execute o seguinte comando:
```
gcloud resource-manager org-policies disable-enforce \
  iam.disableCrossProjectServiceAccountUsage \
  --project=PROJECT_ID
```

Solução de problemas do Workbench do Agent Platform Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Instâncias do Workbench do Agent Platform

Solução de problemas com ferramentas de IA

Solução de problemas com as investigações do Cloud Assist

Resolver problemas com arquivos de diagnóstico usando a CLI do Gemini

Como se conectar e abrir o JupyterLab

Nada acontece após clicar em Abrir JupyterLab

Não é possível acessar o terminal em uma instância do Agent Platform Workbench

Erro 502 ao abrir o JupyterLab

O notebook não responde

Não foi possível se conectar à instância do Agent Platform Workbench usando SSH

A cota de GPU foi excedida

Como criar instâncias do Workbench do Agent Platform

A instância permanece no estado pendente indefinidamente ou fica presa no status de provisionamento

Não é possível criar uma instância dentro de uma rede VPC compartilhada

Permissões necessárias

Não é possível criar uma instância do Workbench da Agent Platform com um contêiner personalizado

Não é possível usar a CLI do Gemini

O botão "Ativar armazenamento compartilhado" não aparece

Erro 599 ao usar o Serviço Gerenciado para Apache Spark

Não foi possível instalar a extensão JupyterLab de terceiros

Não é possível editar a máquina virtual subjacente

pacotes pip não ficam disponíveis após a adição do ambiente conda

Não é possível acessar ou copiar dados de uma instância com acesso de usuário único

Desligamento inesperado

Os registros da instância mostram erros de conexão ou de tempo limite

Os registros da instância mostram "Não é possível entrar em contato com a API Jupyter: ReadTimeoutError".

O endereço docker0 entra em conflito com o endereçamento da VPC

As reservas especificadas não existem

Procedimentos úteis

Use SSH para se conectar à instância do Agent Platform Workbench

Registrar novamente com o servidor Inverting Proxy

Verificar o status do serviço do Docker

Verifique se o agente do Inverting Proxy está em execução

Verifique o status do serviço Jupyter e colete os registros

Verificar se a API interna do Jupyter está ativa

Reinicie o serviço do Docker

Reiniciar o agente do Inverting Proxy

Reiniciar o serviço Jupyter

Reiniciar o agente de coleta de notebooks

Modificar o script do agente de coleta de notebooks

Verificar se a instância pode resolver os domínios DNS necessários

Fazer uma cópia dos dados do usuário em uma instância

Criar um bucket do Cloud Storage (opcional)

Copiar dados do usuário

Investigar uma instância que está com problemas de provisionamento usando o gcpdiag

Docker

Erros de permissões ao usar papéis de conta de serviço com a Agent Platform

Solução de problemas do Workbench do Agent Platform

pacotes `pip` não ficam disponíveis após a adição do ambiente conda

O endereço `docker0` entra em conflito com o endereçamento da VPC