Ative o operador Ray no Google Kubernetes Engine (GKE)

Esta página mostra como ativar o operador Ray para o Google Kubernetes Engine (GKE), o que lhe permite usar as APIs KubeRay para dimensionar e gerir clusters Ray. Para mais informações sobre o Ray e o KubeRay, consulte a vista geral do Ray no GKE.

Antes de começar

Antes de começar, certifique-se de que realizou as seguintes tarefas:

  • Ative a API Google Kubernetes Engine.
  • Ative a API Google Kubernetes Engine
  • Se quiser usar a CLI gcloud para esta tarefa, instale-a e, em seguida, inicialize-a. Se instalou anteriormente a CLI gcloud, execute o comando gcloud components update para obter a versão mais recente. As versões anteriores da CLI gcloud podem não suportar a execução dos comandos neste documento.

Ative o operador Ray para um cluster

Pode ativar o operador Ray em clusters do GKE Autopilot ou Standard novos ou existentes através da CLI Google Cloud, da Google Cloud consola ou do Terraform.

Consola

  1. Aceda à página do Google Kubernetes Engine na Google Cloud consola.

    Aceda ao Google Kubernetes Engine

  2. Clique em Criar e, de seguida, na secção Padrão ou Autopilot, clique em Configurar.

  3. Para o tipo Padrão, no painel de navegação, em Cluster, clique em Funcionalidades. Para o Autopilot, clique em Definições avançadas.

  4. Na secção IA e aprendizagem automática, selecione a caixa de verificação Ativar operador Ray.

  5. Clique em Criar.

gcloud

Crie um cluster através da opção --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Substitua o seguinte:

  • CLUSTER_NAME: o nome do novo cluster.
  • VERSION: a versão do GKE, que tem de ser 1.30.0-gke.1747000 ou posterior. Também pode usar a opção --release-channel para selecionar um canal de lançamento. O canal de lançamento tem de ter uma versão predefinida de 1.30.0-gke.1747000 ou posterior.

Pode ativar o operador Ray num cluster existente através do comando gcloud container clusters update com a opção --update-addons=RayOperator=ENABLED.

Terraform

O exemplo do Terraform seguinte cria e configura um cluster Standard:

resource "google_container_cluster" "default" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }
}

Para saber mais sobre a utilização do Terraform, consulte o artigo Compatibilidade do Terraform com o GKE.

Controlo de versões

O operador Ray está disponível nas seguintes versões secundárias do GKE com uma versão correspondente do KubeRay:

Versão secundária do GKE Versão do KubeRay
1,33 v1.3
1,32 v1.2
1.31 v1.2
1,30 v1.1
1,29 v1.1

Verifique se o operador Ray está ativado

Pode verificar se o operador do Ray está ativado num cluster do GKE Autopilot ou Standard através da CLI gcloud ou da Google Cloud consola.

Consola

  1. Aceda à página do Google Kubernetes Engine na Google Cloud consola.

    Aceda ao Google Kubernetes Engine

  2. Na lista de clusters, clique no nome do cluster que quer validar.

  3. Na secção Funcionalidades, confirme que a caixa de verificação Operador de raios está selecionada.

gcloud

Descreva o seu cluster:

gcloud container clusters describe CLUSTER_NAME

Substitua CLUSTER_NAME pelo nome do cluster.

O resultado é semelhante ao seguinte

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Este resultado indica que o operador Ray está ativado para o cluster.

O que se segue?