Dieses Dokument enthält die Best Practices und Richtlinien für Dataflow beim Ausführen von Arbeitslasten für generative KI auf Google Cloud. Verwenden Sie Dataflow mit Vertex AI, um komplexe Pipelines zu erstellen, mit denen Daten aus verschiedenen Quellen aufgenommen und entsprechend aggregiert werden.
Optionale Dataflow-Steuerelemente
Je nach Datenquelle empfehlen wir, die folgenden Sicherheitskontrollen zu implementieren.
Externe IP-Adressen für Dataflow-Jobs deaktivieren
| Google-Einstellungs-ID | DF-CO-6.1 |
|---|---|
| Kategorie | Optional |
| Beschreibung | Deaktivieren Sie externe IP-Adressen für Verwaltungs- und Monitoringaufgaben, die mit Dataflow-Jobs zusammenhängen. Konfigurieren Sie stattdessen den Zugriff auf Ihre Dataflow-Worker-VMs über SSH. Aktivieren Sie den privaten Google-Zugriff und geben Sie eine der folgenden Optionen in Ihrem Dataflow-Job an:
Wobei:
|
| Entsprechende Produkte |
|
| Zugehörige NIST-800-53-Kontrollen |
|
| Zugehörige CRI-Profileinstellungen |
|
| Weitere Informationen |
Netzwerktags für Firewallregeln verwenden
| Google-Einstellungs-ID | DF-CO-6.2 |
|---|---|
| Kategorie | Optional |
| Beschreibung | Netzwerk-Tags sind Textattribute, die an Compute Engine-VMs wie Dataflow-Worker-VMs angehängt werden. Mit Netzwerk-Tags können Sie VPC-Netzwerk-Firewallregeln und bestimmte benutzerdefinierte statische Routen für bestimmte VM-Instanzen festlegen. Dataflow unterstützt das Hinzufügen von Netzwerk-Tags zu allen Worker-VMs, die einen bestimmten Dataflow-Job ausführen. |
| Entsprechende Produkte |
|
| Zugehörige NIST-800-53-Kontrollen |
|
| Zugehörige CRI-Profileinstellungen |
|
| Weitere Informationen |