Der Schutz sensibler Daten enthält zahlreiche integrierte infoType Detektoren. Sie können aber auch Ihre eigenen erstellen. Sie können das Erkennungsverhalten anpassen. Definieren Sie dazu Ihre eigenen benutzerdefinierten infoType-Detektoren, sodass der Schutz sensibler Daten sensible Daten, die mit von Ihnen angegebenen Mustern übereinstimmen, untersucht oder de-identifiziert. Es gibt folgende Arten von benutzerdefinierten infoType-Detektoren:
- Reguläre benutzerdefinierte Wörterbuchdetektoren sind einfache Wort- und Wortgruppenlisten, nach denen der Schutz sensibler Daten auf Übereinstimmungen prüft. Verwenden Sie reguläre benutzerdefinierte Wörterbuchdetektoren, wenn Ihre Wortzahl nicht mehr als mehrere hunderttausend Wörter beträgt.
- Große benutzerdefinierte Wörterbuchdetektoren werden vom Schutz sensibler Daten unter Verwendung umfangreicher Listen von Wörtern oder Wortgruppen generiert, die entweder in Cloud Storage oder BigQuery gespeichert sind. Verwenden Sie große benutzerdefinierte Wörterbuchdetektoren, wenn Sie eine große Liste mit (bis zu zehn Millionen) Wörtern oder Wortgruppen haben.
- Detektoren regulärer Ausdrücke (Regex-Detektoren) ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen anhand eines regulären Ausdrucksmusters zu erkennen.
- Metadatenlabel-Detektoren ermöglichen es dem Schutz sensibler Daten, Übereinstimmungen basierend auf dem Vorhandensein bestimmter Schlüssel/Wert-Paare in den Content-Metadaten zu erkennen.
- Ersatz-infoType-Detektoren erkennen die Ausgabe der De-Identifikationstransformation
des Schutzes sensibler Daten
CryptoReplaceFfxFpeConfig. Dieser benutzerdefinierte infoType-Detektor wird ausschließlich mit dercontent:reidentifyMethode verwendet, um die De-Identifikation mit formatbewahrender Verschlüsselung (Format-Preserving Encryption, FPE) im FFX-Modus rückgängig zu machen. Aus diesem Grund werden Ersatzdetektoren in diesen Themen nicht ausführlich beschrieben. Weitere Informationen darüber, wie und wann benutzerdefinierte infoType-Ersatzdetektoren verwendet werden, lesen Sie unter Pseudonymisierung.
Sie können Prüfregeln erstellen, um die Scanergebnisse zu verfeinern.
Weitere Informationen zu benutzerdefinierten infoType-Detektoren finden Sie auf der Seite, auf der das Konzept InfoTypes und infoType detectors erläutert wird. Einige Beispiele, die Sie nach Belieben verwenden oder ändern können, finden Sie unter Beispiele für benutzerdefinierte infoType Detektoren. Außerdem wird in diesem Thema beschrieben, wie Sie mit dem Schutz sensibler Daten Ihre eigenen benutzerdefinierten infoType-Detektoren erstellen können.
Einsatzmöglichkeiten für benutzerdefinierte infoType-Detektoren
Benutzerdefinierte infoType-Detektoren werden im Objekt CustomInfoType definiert. Sie geben im Objekt InspectConfig einen CustomInfoType an, wenn Sie Folgendes konfigurieren:
- Inspektion mit
projects.content.inspect - Inspektionsjobs in
InspectJobConfig - Inspektionsvorlagen in
InspectTemplate - De-Identifikation mit
projects.content.deidentify - De-Identifikationsvorlagen in
DeidentifyTemplate - Re-Identifikation von Inhalten, die im FX-Modus mit FPE de-identifiziert wurden, mithilfe von
projects.content.reidentifyDieses Szenario ist spezifisch für benutzerdefinierte infoType-Ersatzdetektoren.
API-Übersicht
Mit dem Objekt CustomInfoType können Sie einen benutzerdefinierten infoType-Detektor für neuen Inhalt erstellen oder die Ergebnisse vordefinierter infoType-Detektoren optimieren.
Das Objekt CustomInfoType besteht aus den folgenden Feldern, die wie beschrieben festgelegt werden:
"infotype": Name des benutzerdefinierten infoType-Detektors in einemInfoType-Objekt"likelihood": StandardwertLikelihood, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Sie können in"detectionRules"alternativeLikelihood-Werte angeben, die diese Basis-Likelihoodersetzen, wenn das Ergebnis den Kriterien der Regel entspricht. Wenn Sie das Feld"likelihood"nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig aufVERY_LIKELYgesetzt. Weitere Informationen zur Wahrscheinlichkeit finden Sie auf der Konzeptseite Wahrscheinlichkeit."detectionRules": Eine Reihe von ObjektenDetectionRule, die zusätzlich auf alle Ergebnisse dieses benutzerdefinierten infoType-Detektors angewendet werden sollen. Hier geben Sie Hotword-Regeln als ObjektHotwordRulean. Regeln werden in der Reihenfolge angewendet, in der sie angegeben sind. Dieses Feld gilt nicht fürSurrogateType-Objekte."sensitivityScore": DerSensitivityScoreWert, der für diesen benutzerdefinierten infoType-Detektor zurückgegeben werden soll. Wenn Sie das Feld"sensitivityScore"nicht einfügen, wird der benutzerdefinierte infoType-Detektor standardmäßig aufVERY_LIKELYgesetzt.Sensitivitätsbewertungen werden in Datenprofilen verwendet. Beim Erstellen von Datenprofilen verwendet der Schutz sensibler Daten die Sensitivitätsbewertungen der infoTypes, um den Sensitivitätsgrad zu berechnen.
Eines der folgenden Felder, abhängig von der Art des benutzerdefinierten infoType-Detektors, den Sie erstellen:
"dictionary": Ein ObjektDictionary, das eine Liste von Wörtern oder Wortgruppen enthält, nach denen gesucht werden soll"regex": Ein ObjektRegexmit einem einzelnen Muster, das den regulären Ausdruck definiert"surrogateType": Ein ObjektSurrogateTypegibt, falls vorhanden, an, dass der benutzerdefinierte infoType-Detektor ein Ersatzwert ist. Weitere Informationen zur Verwendung von benutzerdefinierten infoType-Ersatzdetektoren finden Sie unter Pseudonymisierung."storedType": Ein Verweis auf ein vorhandenesStoredInfoTypeObjekt. Dieses Feld ist erforderlich, wenn Sie einen großen benutzerdefinierten Wörterbuchdetektor erstellen. Sie können zwar reguläre Wörterbuchdetektoren oder Detektoren regulärer Ausdrücke erstellen, indem Sie dieses Feld definieren, es ist jedoch einfacher, diese zu erstellen, indem Sie das Felddictionarybzw. das Feldregexdefinieren."metadata_key_value_expression": EinMetadataKeyValueExpressionObjekt, das reguläre Ausdrücke für den Schlüssel und den Wert definiert, nach denen in den Content-Metadaten gesucht werden soll.
Nächste Schritte
Weitere Informationen zum Erstellen von benutzerdefinierten infoTypes finden Sie in den folgenden Themen:
- Regulären benutzerdefinierten Wörterbuchdetektor erstellen: Erfahren Sie, wie Sie einen benutzerdefinierten infoType-Detektor erstellen, um Übereinstimmungen in einer Liste von Wörtern und Wortgruppen zu finden.
- Großen benutzerdefinierten Wörterbuchdetektor erstellen: Erfahren Sie, wie Sie Übereinstimmungen in einer sehr großen Liste von Wörtern und Wortgruppen finden. Gespeicherte benutzerdefinierte infoType-Detektoren können bis zu mehrere Millionen Wörter abgleichen.
- Benutzerdefinierten Regex-Detektor erstellen: Erfahren Sie, wie Sie einen benutzerdefinierten infoType-Detektor erstellen, um Übereinstimmungen mit einem regulären Ausdruck zu finden.
- InfoType-Detektoren zum Verfeinern von Scanergebnissen anpassen: Erfahren Sie, wie Sie Modifikatoren für integrierte und für benutzerdefinierte infoType-Detektoren erstellen, mit denen Sie Scanergebnisse verfeinern können.
- Übereinstimmungswahrscheinlichkeit anpassen: Erfahren Sie, wie Sie Erkennungsregeln und Hotwords verwenden, um die Wahrscheinlichkeitswerte anzupassen, die Übereinstimmungen mit benutzerdefinierten Detektoren zugeordnet sind.
- Beispiele für benutzerdefinierte infoType-Detektoren: Mehrere Definitionen benutzerdefinierter JSON-infoType-Detektoren, die Sie nach Belieben verwenden oder ändern können.