Comece a usar clusters de preparação

Se tiver interesse em clusters de preparação do Vertex AI, contacte o seu representante de vendas para aceder.

Antes de poder implementar o seu primeiro cluster em clusters de preparação do Vertex AI, tem de configurar o seu projeto e ambiente doGoogle Cloud . Este guia aborda todos os pré-requisitos necessários, que se dividem em três categorias principais:

  • Acesso ao projeto: obter acesso ao serviço, que é apenas por convite.

  • Configuração de recursos: ativar APIs e configurar os serviços de rede e armazenamento de VPC necessários.

  • Autorizações do utilizador: conceder as funções de IAM necessárias para a gestão do cluster e o acesso aos recursos.

A conclusão destes passos prepara o seu projeto para uma implementação bem-sucedida.

Pré-requisitos

Para usar clusters de preparação, tem de:

  1. Adicione o seu projeto à lista de autorizações contactando o seu representante de vendas para obter acesso.
  2. Obtenha capacidade para clusters de GPU em regiões suportadas.
  3. Ative as APIs necessárias, incluindo as APIs Compute Engine, Filestore, Cloud Storage, Lustre gerido (opcional), Hypercomputer Configuration Service e Vertex AI.
  4. Configure a rede garantindo que uma rede existente cumpre condições específicas (por exemplo, acesso privado da Google, regras de firewall) ou criando uma nova rede VPC e uma sub-rede.
  5. Configure o armazenamento criando uma instância do Filestore zonal ou regional para servir como o diretório /home e, opcionalmente, configurando uma Google Cloud instância do Lustre gerida.
  6. Conceda autorizações de IAM aos utilizadores para a gestão de clusters, acesso ao armazenamento e acesso SSH aos nós do cluster, conforme descrito na secção Autorizações de IAM.

Regiões suportadas

  • us-central1
  • us-east1
  • us-east4
  • us-east5
  • us-south1
  • us-west1
  • us-west4
  • asia-southeast1
  • europe-west1
  • europe-west4
  • europe-north1

Autorizações de IAM

  1. Conceda a função de roles/aiplatform.admin aos utilizadores que vão gerir os seus clusters de preparação.
  2. Atribua a função roles/aiplatform.viewer aos utilizadores que apenas precisam de ver os clusters e as respetivas configurações.
  3. Conceda as seguintes funções de IAM ao utilizador ou à conta de serviço que vai gerir (criar, eliminar e atualizar) clusters de preparação geridos:

    Nome da Função ID da função
    Administrador de instâncias do Compute (v1) roles/compute.instanceAdmin.v1
    Escritor de registos roles/logging.logWriter
    Escritor de métricas de monitorização roles/monitoring.metricWriter
    Utilizador da conta de serviço roles/iam.serviceAccountUser
    Administrador de Service Networking roles/servicenetworking.networksAdmin
  4. Para permitir que os nós do cluster leiam e escrevam em contentores do Cloud Storage através do Google Cloud Storage FUSE, conceda a função de utilizador de objetos de armazenamento (roles/storage.objectUser) à conta de serviço usada pelas VMs.

  5. Para o acesso SSH aos nós de início de sessão do Slurm, conceda as seguintes autorizações:

    Autorizações Descrições Finalidade
    Início de sessão do SO Compute Inicie sessão numa VM como utilizador padrão (não administrador). Se precisar de sudo, use o Início de sessão de administrador do SO do Compute em alternativa. SSH para o nó de início de sessão implementado
    Utilizador do túnel protegido por IAP Aceder a recursos do túnel que usam o Identity-Aware Proxy. SSH para o nó de início de sessão implementado

Ativar APIs

  1. Ative a API Google Compute Engine:

       gcloud services enable compute.googleapis.com
    
    
  2. Ative a rede de serviços, uma vez que o Filestore tem de ser implementado antes de criar o cluster.

       gcloud services enable servicenetworking.googleapis.com
    
  3. Ative a API Cloud Storage:

        gcloud services enable storage.googleapis.com
    
  4. Ative a API Lustre (se estiver a usar o Lustre):

    gcloud services enable lustre.googleapis.com
    
    
  5. Ative a API HCS:

    gcloud services enable hypercomputecluster.googleapis.com
    
    
  6. Ative a API Vertex AI:

    gcloud services enable aiplatform.googleapis.com
    
    
  7. Ative a API Cloud Resource Manager:

    gcloud services enable cloudresourcemanager.googleapis.com
    
    

O que se segue?

Para um guia detalhado sobre como criar um cluster de preparação e executar as suas cargas de trabalho de IA/ML, contacte o seu representante de vendas.