Auf dieser Seite erfahren Sie, wie Sie die Netzwerkbandbreite für GPU-Knoten in GKE-Clustern (Google Kubernetes Engine) mithilfe von Google Virtual NIC (gVNIC) erhöhen.
In Autopilot-Clustern wird auf Knoten, auf denen die GKE-Version 1.30.2-gke.1023000 oder höher ausgeführt wird, automatisch eine Google Virtual NIC (gVNIC) installiert. Die Anleitung auf dieser Seite gilt nur für Standardcluster.
Wenn Sie die Bandbreite auf CPU-Knoten erhöhen möchten, aktivieren Sie Stufe-1-Bandbreite.
Hinweise
Führen Sie die folgenden Aufgaben aus, bevor Sie beginnen:
- Aktivieren Sie die Google Kubernetes Engine API. Google Kubernetes Engine API aktivieren
- Wenn Sie die Google Cloud CLI für diesen Task verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit dem Befehl
gcloud components update
ab. In früheren gcloud CLI-Versionen werden die Befehle in diesem Dokument möglicherweise nicht unterstützt.
Beschränkungen
- Es gelten Einschränkungen für Compute Engine.
Voraussetzungen
- GKE-Knoten müssen ein Knoten-Image für Container-Optimized OS verwenden.
gVNIC aktivieren
Sie können einen Cluster mit Knotenpools erstellen, die gVNIC verwenden, einen Knotenpool mit aktivierter gVNIC erstellen oder einen Knotenpool aktualisieren, um gVNIC zu verwenden.
Cluster erstellen
Erstellen Sie einen Cluster mit Knotenpools, die gVNIC verwenden:
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
Dabei gilt:
CLUSTER_NAME
ist der Name des neuen Clusters.GPU_TYPE
: Der Typ des von Ihnen verwendeten GPU-Beschleunigers. Beispiel:nvidia-tesla-t4
AMOUNT
: Die Anzahl der GPUs, die an Knoten im Knotenpool angehängt werden sollen.MACHINE_TYPE
: Der Maschinentyp, den Sie verwenden möchten. gVNIC wird auf speicheroptimierten Maschinentypen nicht unterstützt.
Knotenpool erstellen
Erstellen Sie einen Knotenpool, der gVNIC verwendet:
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Dabei gilt:
NODEPOOL_NAME
: Der Name eines neuen Knotenpools.CLUSTER_NAME
den Namen des vorhandenen Clusters.
Knotenpool aktualisieren
Aktualisieren Sie einen Knotenpool, um gVNIC zu verwenden:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Dabei gilt:
NODEPOOL_NAME
: Den Namen des Knotenpools, den Sie aktualisieren möchten.CLUSTER_NAME
den Namen des vorhandenen Clusters.
Für diese Änderung müssen die Knoten neu erstellt werden, was zu Unterbrechungen Ihrer laufenden Arbeitslasten führen kann. Details zu dieser spezifischen Änderung finden Sie in der entsprechenden Zeile in der Tabelle Manuelle Änderungen, die die Knoten mithilfe einer Knotenupgrade-Strategie neu erstellen, ohne Wartungsrichtlinien zu berücksichtigen. Weitere Informationen zu Knotenupdates finden Sie unter Unterbrechungen durch Knotenupdates planen.
gVNIC deaktivieren
Aktualisieren Sie den Knotenpool mit dem Flag --no-enable-gvnic
:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
Für diese Änderung müssen die Knoten neu erstellt werden, was zu Unterbrechungen Ihrer laufenden Arbeitslasten führen kann. Details zu dieser spezifischen Änderung finden Sie in der entsprechenden Zeile in der Tabelle Manuelle Änderungen, die die Knoten mithilfe einer Knotenupgrade-Strategie neu erstellen, ohne Wartungsrichtlinien zu berücksichtigen. Weitere Informationen zu Knotenupdates finden Sie unter Unterbrechungen durch Knotenupdates planen.
Fehlerbehebung
Informationen zur Fehlerbehebung für gVNIC finden Sie unter Fehlerbehebung bei Google Virtual NIC.
Nächste Schritte
- Verwenden Sie das Logging von Netzwerkrichtlinien, um aufzuzeichnen, wann Verbindungen zu Pods von den Netzwerkrichtlinien Ihres Clusters zugelassen oder verweigert werden.