Benutzerdefinierte infoType-Detektoren

Der Schutz sensibler Daten enthält zahlreiche integrierte infoType Detektoren. Sie können aber auch Ihre eigenen erstellen. Sie können das Erkennungsverhalten anpassen. Definieren Sie dazu Ihre eigenen benutzerdefinierten infoType-Detektoren, sodass der Schutz sensibler Daten sensible Daten, die mit von Ihnen angegebenen Mustern übereinstimmen, untersucht oder de-identifiziert. Es gibt folgende Arten von benutzerdefinierten infoType-Detektoren:

  • Reguläre benutzerdefinierte Wörterbuchdetektoren sind einfache Wort- und Wortgruppenlisten, nach denen der Schutz sensibler Daten auf Übereinstimmungen prüft. Verwenden Sie reguläre benutzerdefinierte Wörterbuchdetektoren, wenn Ihre Wortzahl nicht mehr als mehrere hunderttausend Wörter beträgt.
  • Große benutzerdefinierte Wörterbuchdetektoren werden vom Schutz sensibler Daten unter Verwendung umfangreicher Listen von Wörtern oder Wortgruppen generiert, die entweder in Cloud Storage oder BigQuery gespeichert sind. Verwenden Sie große benutzerdefinierte Wörterbuchdetektoren, wenn Sie eine große Liste mit (bis zu zehn Millionen) Wörtern oder Wortgruppen haben.
  • Detektoren regulärer Ausdrücke (Regex-Detektoren) ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen anhand eines regulären Ausdrucksmusters zu erkennen.
  • Metadatenlabel-Detektoren ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen basierend auf dem Vorhandensein bestimmter Schlüssel/Wert-Paare in den Content-Metadaten zu erkennen.
  • Ersatz-infoType-Detektoren erkennen die Ausgabe der De-Identifikationstransformation des Schutzes sensibler Daten CryptoReplaceFfxFpeConfig. Dieser benutzerdefinierte infoType-Detektor wird ausschließlich mit der content:reidentify Methode verwendet, um die De-Identifikation mit formatbewahrender Verschlüsselung (Format-Preserving Encryption, FPE) im FFX-Modus rückgängig zu machen. Aus diesem Grund werden Ersatzdetektoren in diesen Themen nicht ausführlich beschrieben. Weitere Informationen darüber, wie und wann benutzerdefinierte infoType-Ersatzdetektoren verwendet werden, lesen Sie unter Pseudonymisierung.

Sie können Prüfregeln erstellen, um die Scanergebnisse zu verfeinern.

Weitere Informationen zu benutzerdefinierten infoType-Detektoren finden Sie auf der Seite, auf der das Konzept InfoTypes und infoType detectors erläutert wird. Einige Beispiele, die Sie nach Belieben verwenden oder ändern können, finden Sie unter Beispiele für benutzerdefinierte infoType Detektoren. Außerdem wird in diesem Thema beschrieben, wie Sie mit dem Schutz sensibler Daten Ihre eigenen benutzerdefinierten infoType-Detektoren erstellen können.

Einsatzmöglichkeiten für benutzerdefinierte infoType-Detektoren

Benutzerdefinierte infoType-Detektoren werden im Objekt CustomInfoType definiert. Sie geben im Objekt InspectConfig einen CustomInfoType an, wenn Sie Folgendes konfigurieren:

API-Übersicht

Mit dem Objekt CustomInfoType können Sie einen benutzerdefinierten infoType-Detektor für neuen Inhalt erstellen oder die Ergebnisse vordefinierter infoType-Detektoren optimieren.

Das Objekt CustomInfoType besteht aus den folgenden Feldern, die wie beschrieben festgelegt werden:

  • "infotype": Name des benutzerdefinierten infoType-Detektors in einem InfoType-Objekt
  • "likelihood": Standardwert Likelihood, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Sie können in "detectionRules" alternative Likelihood-Werte angeben, die diese Basis-Likelihood ersetzen, wenn das Ergebnis den Kriterien der Regel entspricht. Wenn Sie das Feld "likelihood" nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt. Weitere Informationen zur Wahrscheinlichkeit finden Sie auf der Konzeptseite Wahrscheinlichkeit.
  • "detectionRules": Eine Reihe von Objekten DetectionRule, die zusätzlich auf alle Ergebnisse dieses benutzerdefinierten infoType-Detektors angewendet werden sollen. Hier geben Sie Hotword-Regeln als Objekt HotwordRule an. Regeln werden in der Reihenfolge angewendet, in der sie angegeben sind. Dieses Feld gilt nicht für SurrogateType-Objekte.
  • "sensitivityScore": Der SensitivityScore Wert, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Wenn Sie das Feld "sensitivityScore" nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig auf VERY_LIKELY gesetzt.

    Sensitivitätsbewertungen werden in Datenprofilen verwendet. Beim Erstellen von Datenprofilen verwendet der Schutz sensibler Daten die Sensitivitätsbewertungen der infoTypes, um den Sensitivitätsgrad zu berechnen.

  • Eines der folgenden Felder, abhängig von der Art des benutzerdefinierten infoType-Detektors, den Sie erstellen:

    • "dictionary": Ein Objekt Dictionary, das eine Liste von Wörtern oder Wortgruppen enthält, nach denen gesucht werden soll
    • "regex": Ein Objekt Regex mit einem einzelnen Muster, das den regulären Ausdruck definiert
    • "surrogateType": Ein Objekt SurrogateType gibt, falls vorhanden, an, dass der benutzerdefinierte infoType-Detektor ein Ersatzwert ist. Weitere Informationen zur Verwendung von benutzerdefinierten infoType-Ersatzdetektoren finden Sie unter Pseudonymisierung.
    • "storedType": Ein Verweis auf ein vorhandenes StoredInfoType Objekt. Dieses Feld ist erforderlich, wenn Sie einen großen benutzerdefinierten Wörterbuchdetektor erstellen. Sie können zwar reguläre Wörterbuchdetektoren oder Detektoren regulärer Ausdrücke erstellen, indem Sie dieses Feld definieren, es ist jedoch einfacher, diese zu erstellen, indem Sie das Feld dictionary bzw. das Feld regex definieren.
    • "metadata_key_value_expression": Ein MetadataKeyValueExpression Objekt, das reguläre Ausdrücke für den Schlüssel und den Wert definiert, nach denen in den Content-Metadaten gesucht werden soll.

Nächste Schritte

Weitere Informationen zum Erstellen von benutzerdefinierten infoTypes finden Sie in den folgenden Themen: