Arbeitslasten bereitstellen

Wie Sie in unserer Anleitung zum Clusterlebenszyklus lesen können, verwenden Sie als GKE-Nutzer in der Regel Google Cloud Tools für die Clusterverwaltung und Kubernetes-Tools wie kubectl für clusterinterne Aufgaben wie die Bereitstellung von Anwendungen. Wenn Sie also bereits mit der Bereitstellung von Arbeitslasten in einer anderen Kubernetes-Implementierung vertraut sind, sollten viele der gleichen Arbeitsabläufe auch für die Bereitstellung von Arbeitslasten in GKE gelten. (Wenn Sie noch nicht mit der Bereitstellung von Arbeitslasten in Kubernetes vertraut sind, lesen Sie den Abschnitt Bereitstellungen und die anderen Ressourcen unter Erste Schritte mit Kubernetes.)

GKE bietet jedoch auch zusätzliche Funktionen für die Bereitstellung und Verwaltung Ihrer Arbeitslasten, darunter Tools zur Beobachtbarkeit, vollständig verwaltete Datenbankoptionen für zustandsorientierte Anwendungen und spezifische Hardwareoptionen für spezielle Arbeitslasttypen, einschließlich KI-/ML-Arbeitslasten.

Auf dieser Seite finden Sie eine kurze Übersicht für Entwickler und Administratoren, die Arbeitslasten in GKE-Clustern bereitstellen möchten, mit Links zu detaillierteren Dokumentationen. Viele weitere spezifische Anleitungen und Tutorials finden Sie in den Abschnitten Bereitstellen... der GKE-Hauptdokumentation.

Bevor Sie diese Seite lesen, sollten Sie mit den folgenden Themen vertraut sein:

Erforderliche Rollen

Wenn Sie kein Projektinhaber sind, benötigen Sie mindestens die folgende IAM-Rolle (Identity and Access Management), um Arbeitslasten bereitzustellen:

  • Betrachter für Kubernetes Engine-Cluster (roles/container.clusterViewer): Diese Rolle bietet die container.clusters.get Berechtigung, die für die Authentifizierung bei Clustern in einem Google Cloud Projekt erforderlich ist. Sie sind damit jedoch nicht autorisiert, Aktionen innerhalb dieser Cluster auszuführen. Ihr Clusteradministrator kann Sie mit IAM oder Kubernetes RBAC autorisieren, andere Aktionen im Cluster auszuführen.

    Ausführliche Informationen zu allen in dieser Rolle enthaltenen Berechtigungen und zum Zuweisen einer Rolle mit Lese-/Schreibberechtigungen finden Sie in der IAM-Dokumentation unter Kubernetes Engine Rollen.

Weitere Informationen zur Zugriffssteuerung in GKE finden Sie unter Zugriffssteuerung.

Zustandslose Anwendungen

Zustandslose Anwendungen sind Anwendungen, die weder Daten noch den Anwendungsstatus im Cluster oder im nichtflüchtigen Speicher speichern. Zustandslose Anwendungen können sowohl direkt über das Menü Arbeitslasten in der Google Cloud Console als auch über die Kubernetes API bereitgestellt werden. Informationen zum Bereitstellen einer zustandslosen Linux-Anwendung in GKE finden Sie unter Zustandslose Linux Anwendung bereitstellen. Alternativ können Sie auch erfahren, wie Sie eine zustandslose Windows Server Anwendung bereitstellen.

Zustandsorientierte Anwendungen und Speicher

Anwendungen, die Daten speichern müssen, die über die Lebensdauer ihres Pods hinaus bestehen, werden als zustandsorientierte Anwendungen bezeichnet. Sie oder Ihr Administrator können ein Kubernetes-PersistentVolume-Objekt verwenden, um diesen Speicher bereitzustellen. In GKE wird der PersistentVolume-Speicher durch Compute Engine-Festplatten gesichert. Informationen zum Bereitstellen einer einfachen zustandsorientierten Anwendung in GKE finden Sie unter Zustandsorientierte Anwendung bereitstellen.

Wenn die Daten Ihrer zustandsorientierten Anwendung in einer Datenbank und nicht in einem Speicher gespeichert werden sollen, der an die Lebensdauer eines Clusters gebunden ist, bietet GKE die folgenden Optionen:

  • Vollständig verwaltete Datenbanken: Eine verwaltete Datenbank wie Cloud SQL oder Spanner bietet einen geringeren operativen Aufwand und ist für die Google Cloud Infrastruktur optimiert. Verwaltete Datenbanken sind weniger mühsam zu warten und zu betreiben als eine Datenbank, die Sie direkt in Kubernetes bereitstellen.
  • Kubernetes-Anwendung: Sie können eine Datenbankinstanz (z. B. MySQL oder PostgreSQL) auf einem GKE-Cluster bereitstellen und ausführen.

Weitere Informationen zu Datenoptionen in GKE finden Sie unter Daten in GKE und Datenbankbereitstellungen in GKE planen.

KI-/ML-Arbeitslasten

GKE bietet umfassende Unterstützung für die Bereitstellung von KI-/ML Arbeitslasten. Dazu gehören die Unterstützung für das Trainieren und Bereitstellen von Modellen auf spezieller Hardware sowie die flexible Einbindung in verteilte Computing- und Datenverarbeitungs-Frameworks. Weitere Informationen finden Sie in den folgenden Anleitungen:

  • Unter Cloud TPU in GKE erfahren Sie, wie Sie Cloud TPU-Beschleuniger für KI-/ML-Arbeitslasten in GKE verwenden. GKE bietet vollständige Unterstützung für die Verwaltung des Lebenszyklus von TPU-Knoten und ‑Knotenpools, einschließlich des Erstellens, Konfigurierens und Löschens von TPU-VMs. Sie können TPU-Arbeitslasten sowohl in Standard- als auch in Autopilot-Clustern bereitstellen.
  • Unter GPUs in GKE erfahren Sie, wie Sie GPU-Hardware mit GKE Arbeitslasten anfordern und verwenden.

Arbeitslasten mit anderen besonderen Anforderungen

GKE bietet Funktionen und Anleitungen, mit denen Sie Arbeitslasten mit anderen besonderen Anforderungen bereitstellen können, einschließlich Anwendungen, die bestimmte Knotenarchitekturen erfordern oder deren Pods auf denselben oder verschiedenen Knoten ausgeführt werden müssen. Weitere Informationen zum Bereitstellen einiger dieser Arbeitslasten finden Sie in den folgenden Anleitungen:

  • Unter Compute-Klassen in Autopilot wird beschrieben, wie Sie bestimmte Compute-Architekturen für die Planung Ihrer Pods auswählen können, wenn Sie Anwendungen in Autopilot-Clustern bereitstellen. Bei Standardclustern können Sie beim Erstellen eines Clusters direkt die Maschinenfamilie angeben, die Sie für Ihre Knoten verwenden möchten.
  • Unter Benutzerdefinierte Compute-Klassen wird beschrieben, wie Sie benutzerdefinierte Compute-Klassen erstellen können, um noch mehr Flexibilität bei der Angabe von Hardwareoptionen für Ihre Anwendungen in Autopilot- und Standardclustern zu erhalten.
  • Unter Arbeitslasttrennung in GKE konfigurieren erfahren Sie, wie Sie dafür sorgen, dass die Pods Ihrer Anwendung auf denselben oder verschiedenen zugrunde liegenden Maschinen ausgeführt werden.
  • GKE Sandbox erklärt , wie Sie Ihren Hostkernel mit Sandbox-Pods schützen können, wenn Sie unbekannte oder nicht vertrauenswürdige Arbeitslasten bereitstellen.

Arbeitslasten beobachten

GKE bietet eine Reihe von Funktionen zum Beobachten Ihrer Arbeitslasten und ihres Zustands, darunter Übersichten über den Arbeitslaststatus und Messwerte in der Google Cloud Console sowie detailliertere Messwerte, Logs und Benachrichtigungen.

Bereitstellung von Arbeitslasten verwalten

Wenn Sie oder Ihr Administrator eine CI/CD-Pipeline (Continuous Integration and Delivery) für die Bereitstellung Ihrer Arbeitslasten einrichten möchten, finden Sie unter Best Practices für Continuous Integration und Continuous Delivery in GKE GKE-spezifische Best Practices und Richtlinien für CI/CD sowie Tutorials zum Einrichten von CI/CD-Pipelines mit bestimmten Tools und Produkten.

Nächste Schritte