Cloud Data Loss Prevention (Cloud DLP) ist jetzt Teil des Schutzes sensibler Daten. Der Name der API bleibt unverändert: Cloud Data Loss Prevention API (DLP API). Informationen zu den Diensten, die zum Schutz sensibler Daten gehören, finden Sie unter Schutz sensibler Daten.

Auffinden sensibler Daten für Vertex AI

Auf dieser Seite wird die Sensitive Data Protection-Erkennung für die Verwendung mit Vertex AI beschrieben.

Mit Sensitive Data Protection Discovery können Sie mehr über die Daten in Ihren Vertex AI-Trainingsdatasets und ‑Abstimmungsjobs erfahren. Bei der Erkennung werden Datenprofile generiert, die Informationen wie die erkannten Informationstypen (infoTypes) und die Vertraulichkeitsstufe der Daten enthalten, die Sie zum Trainieren und Optimieren von Modellen verwenden.

Vorteile

Diese Funktion bietet folgende Vorteile:

Sie können Ihre Vertex AI-Datasets und Tuning-Jobs auf Organisations-, Ordner- oder Projektebene auf vertrauliche Daten überwachen und Berichte zu den Ergebnissen erstellen.
Wenn bei der Ermittlung sensible Trainings- oder Optimierungsdaten erkannt werden, können Sie anhand der Datenprofile feststellen, welche Ressourcen genauer untersucht werden müssen. Sie können eine detaillierte Überprüfung durchführen und alle sensiblen Instanzen in einer Ressource finden.
Sie können Erkennungsergebnisse an Security Command Center senden, damit Ihre KI-bezogenen Arbeitslasten mit potenziell sensiblen Daten berücksichtigt werden, wenn Sie den Sicherheitsstatus Ihrer Organisation bewerten.

Unterstützte Datenquelle

Mit dieser Funktion können die folgenden Datentypen profiliert werden, auf die in Ihren Vertex AI-Datasets und ‑Abstimmungsjobs verwiesen wird:

Trainings- und Abstimmungsdaten in Cloud Storage-Buckets. Informationen zu den unterstützten Dateitypen finden Sie unter Dateicluster.
Trainingsdaten in BigQuery-Tabellen

Funktionsweise

Wenn Sie ein Vertex AI-Dataset profilieren, generiert „Schutz sensibler Daten“ ein Dateispeicher-Datenprofil oder ein Tabellendatenprofil, je nachdem, wo die Trainingsdaten gespeichert sind: in einem Cloud Storage-Bucket oder einer BigQuery-Tabelle.

Wenn Sie ein Profil für einen Vertex AI-Abstimmungsjob erstellen, generiert Sensitive Data Protection ein Datenspeicherprofil.

Ein Datenprofil enthält Statistiken und Metadaten zur profilierten Ressource. Für jedes Vertex AI-Dataset oder jeden Vertex AI-Abstimmungsjob enthält das generierte Datenprofil die folgenden Informationen.

Die Vertraulichkeits- und Datenrisikostufen der Trainings- oder Abstimmungsdaten
Die Arten von vertraulichen Informationen, die in den Trainings- oder Abstimmungsdaten gefunden wurden, z. B. Führerschein-IDs und E-Mail-Adressen

Eine vollständige Liste der Statistiken und Metadaten in jedem Datenprofil für Dateispeicher finden Sie unter Datenprofile für Dateispeicher.

Eine vollständige Liste der Statistiken und Metadaten in jedem Tabellendatenprofil finden Sie unter Tabellendatenprofile.

Weitere Informationen zum Discovery-Dienst finden Sie unter Datenprofile.

Preise

Wenn Sie Daten profilieren, fallen Kosten für den Schutz sensibler Daten gemäß dem von Ihnen ausgewählten Abrechnungsmodus für die Erkennung an.

Wenn sich Ihre Trainings- oder Abstimmungsdaten in einem Cloud Storage-Bucket befinden, werden Ihnen außerdem Cloud Storage-Gebühren für Anfragen in Rechnung gestellt, die Sensitive Data Protection zum Profilieren der Daten stellt. In den folgenden Abschnitten werden die entsprechenden Cloud Storage-Gebühren beschrieben, die für Sie anfallen.

Vorgänge der Klasse B

Ihnen werden die Vorgänge der Klasse B (storage.buckets.get) in Rechnung gestellt, die „Schutz sensibler Daten“ beim Profiling von Daten in Ihren Cloud Storage-Buckets ausführt.

Informationen zu den Cloud Storage-Gebühren für Vorgänge der Klasse B finden Sie in der Cloud Storage-Dokumentation unter Gebühren für Vorgänge.

Abrufgebühren

Für Objekte mit einer anderen Speicherklasse als „Standard“ werden Gebühren für den Abruf berechnet. Informationen dazu, wie viel Cloud Storage für den Datenabruf berechnet, finden Sie in der Cloud Storage-Dokumentation unter Abrufgebühren.