Ray-Operator in Google Kubernetes Engine (GKE) aktivieren

Auf dieser Seite wird beschrieben, wie Sie den Ray-Operator für Google Kubernetes Engine (GKE) aktivieren, damit Sie die KubeRay-APIs zum Skalieren und Verwalten von Ray-Clustern verwenden können. Weitere Informationen zu Ray und KubeRay finden Sie unter Ray in der GKE – Übersicht.

Hinweise

Führen Sie die folgenden Aufgaben aus, bevor Sie beginnen:

  • Aktivieren Sie die Google Kubernetes Engine API.
  • Google Kubernetes Engine API aktivieren
  • Wenn Sie die Google Cloud CLI für diesen Task verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit dem Befehl gcloud components update ab. In früheren gcloud CLI-Versionen werden die Befehle in diesem Dokument möglicherweise nicht unterstützt.

Ray Operator für einen Cluster aktivieren

Sie können den Ray-Operator für neue oder vorhandene Autopilot- oder Standard-GKE-Cluster mit der Google Cloud CLI, der Google Cloud Console oder Terraform aktivieren.

Console

  1. Öffnen Sie in der Google Cloud Console die Seite Google Kubernetes Engine.

    Zur Seite "Google Kubernetes Engine"

  2. Klicken Sie auf  Erstellen und dann im Bereich „Standard“ oder „Autopilot“ auf Konfigurieren.

  3. Klicken Sie für Standardcluster im Navigationsbereich unter Cluster auf Features. Klicken Sie für Autopilot auf Erweiterte Einstellungen.

  4. Klicken Sie im Bereich KI und maschinelles Lernen das Kästchen Ray-Operator aktivieren an.

  5. Klicken Sie auf Erstellen.

gcloud

Erstellen Sie mit der Option --addons=RayOperator einen Cluster:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Ersetzen Sie Folgendes:

  • CLUSTER_NAME ist der Name des neuen Clusters.
  • VERSION: die GKE-Version, die mindestens 1.30.0-gke.1747000 sein muss. Sie können auch die Option --release-channel verwenden, um eine Release-Version auszuwählen. Die Release-Version muss die Standardversion 1.30.0-gke.1747000 oder höher haben.

Sie können den Ray-Operator in einem vorhandenen Cluster mit dem Befehl gcloud container clusters update und der Option --update-addons=RayOperator=ENABLED aktivieren.

Terraform

Im folgenden Terraform-Beispiel wird ein Standard-Cluster erstellt und konfiguriert:

resource "google_container_cluster" "default" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }
}

Weitere Informationen zur Verwendung von Terraform finden Sie unter Terraform-Unterstützung für GKE.

Versionsverwaltung

Der Ray Operator ist in den folgenden GKE-Nebenversionen mit einer entsprechenden KubeRay-Version verfügbar:

GKE-Nebenversion KubeRay-Version
1.33 v1.3
1,32 v1.2
1,31 v1.2
1,30 v1.1
1,29 v1.1

Prüfen, ob der Ray-Operator aktiviert ist

Sie können prüfen, ob der Ray-Operator in einem Autopilot- oder Standard-GKE-Cluster aktiviert ist, indem Sie die gcloud CLI oder die Google Cloud Console verwenden.

Console

  1. Öffnen Sie in der Google Cloud Console die Seite Google Kubernetes Engine.

    Zur Seite "Google Kubernetes Engine"

  2. Klicken Sie in der Clusterliste auf den Namen des Clusters, den Sie bestätigen möchten.

  3. Prüfen Sie im Abschnitt Funktionen, ob das Kästchen Ray Operator ausgewählt ist.

gcloud

Beschreiben Sie Ihren Cluster:

gcloud container clusters describe CLUSTER_NAME

Ersetzen Sie CLUSTER_NAME durch den Namen des Clusters.

Die Ausgabe sieht etwa so aus:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Diese Ausgabe zeigt an, dass der Ray-Operator für den Cluster aktiviert ist.

Nächste Schritte