In diesem Dokument werden die Funktionen zum Prüfen und Entfernen von Daten aus Bildern in Sensitive Data Protection beschrieben.
Mithilfe von infoType-Detektoren prüft Sensitive Data Protection ein base64-codiertes Bild und erkennt sensible Daten in dem Bild. Sensitive Data Protection kann dann Informationen über den Speicherort sensibler Daten im Bild zurückgeben oder die sensiblen Daten durch Maskieren mit einem undurchsichtigen Rechteck unkenntlich machen.
Das Prüfen und Entfernen sind zwei separate Vorgänge:
- Prüfen: Sensitive Data Protection prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Dann gibt er die erkannten infoTypes zurück, zusammen mit einem oder mehreren Sätzen von Pixelkoordinaten und Dimensionen. Jeder Satz von Pixelkoordinaten- und Dimensionswerten zeigt jeweils die untere linke Ecke und die Maße der Begrenzungsrahmen an. Jeder Begrenzungsrahmen entspricht einem Ergebnis von Sensitive Data Protection vollständig oder teilweise.
- Entfernen: Der Schutz sensibler Daten prüft das übertragene base64-codierte Bild auf die angegebenen infoTypes. Sensitive Data Protection macht alle Ergebnisse sensibler Daten unkenntlich, indem sie mit undurchsichtigen Rechtecken maskiert werden. Das Ausgabeformat des bearbeiteten base64-codierten Bilds entspricht dem des ursprünglichen Bildformats. Sie können in der Anfrage auch die Farbe der Maskierung festlegen.
Bildprüfung
Der Prüfdienst des Schutzes sensibler Daten akzeptiert ein base64-codiertes Bild und sucht dann im Bild nach Daten, die den Prüfkriterien entsprechen. Der Schutz sensibler Daten gibt die Speicherorte aller erkannten sensiblen Daten zurück.
Betrachten Sie das folgende Bild.
So funktioniert die Bildprüfung:
- Sie senden eine
content.inspect-Anfrage an die DLP API. Die Anfrage enthält das base64-codierte Bild und die Prüfkonfiguration mit Ihren Erkennungs kriterien. - Sensitive Data Protection prüft das Bild anhand der Prüfkonfiguration und identifiziert Übereinstimmungen.
- Sensitive Data Protection gibt die Koordinaten und Dimensionen der Regionen im Bild zurück, in denen sensible Daten gemäß Ihren Erkennungskriterien gefunden wurden.
Die zurückgegebenen Koordinaten geben an, wo die sensiblen Daten zu finden sind. Beachten Sie, dass Sensitive Data Protection häufig mehrere Felder verwendet, um anzuzeigen, wo sich eine einzelne Instanz sensibler Daten im Bild befindet.
Wenn der Schutz sensibler Daten keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird eine die korrekte Verarbeitung bestätigende HTTP 200-Antwort ohne Inhalt zurückgegeben.
Entfernen von Daten aus Bildern
Das Entfernen der Daten entspricht der Bildprüfung, erweitert um einen zusätzlichen Schritt. Nachdem der Schutz sensibler Daten die Speicherorte sensibler Daten im Bild ermittelt hat, werden die Koordinaten der entsprechenden Bereiche nicht zurückgegeben, sondern abgedeckt, und es wird ein base64-codiertes Bild ausgegeben.
So funktioniert das Entfernen von Daten aus Bildern:
- Sie senden eine
image.redactAnfrage an die DLP API. Die Anfrage enthält das base64-codierte Bild und die Konfiguration zum Entfernen von Bilddaten mit Ihren Erkennungs kriterien. - Sensitive Data Protection prüft das Bild anhand der Konfiguration zum Entfernen von Bilddaten und identifiziert Übereinstimmungen.
- Sensitive Data Protection macht alle erkannten sensiblen Daten unkenntlich, indem es sie mit einem undurchsichtigen Rechteck abdeckt. Anschließend wird das Bild in base64 codiert und in der Antwort auf die Anfrage zurückgegeben.
Wenn Sensitive Data Protection keine Daten im Bild findet, die den Erkennungskriterien entsprechen, wird das base64-codierte Bild unverändert zurückgegeben.
Funktionen zur Bilderkennung
In diesem Abschnitt werden die Funktionen zur Bilderkennung beschrieben, die Sie auf Ihre Prüf- und Entfernungsoperationen anwenden können. Für alle diese Funktionen müssen Sie die Prüfung an einem Standort durchführen, der das Scannen von Bildern unterstützt.
Text in Bildern erkennen
Sensitive Data Protection verwendet die optische Zeichenerkennung (OCR), um Text in Bildern zu erkennen. Der Schutz sensibler Daten analysiert den erkannten Text auf ähnliche Weise wie einen Textkörper.
Wenn Sie Text in Bildern erkennen möchten, geben Sie in Ihrer Prüf- oder Entfernungsoperation einen textbasierten infoType an, z. B. PERSON_NAME und CREDIT_CARD_NUMBER.
Objekte und Themen in Bildern erkennen
Der Schutz sensibler Daten kann die Pixel und Merkmale von Bildern analysieren, die nicht hauptsächlich textbasiert sind. Sensitive Data Protection verwendet diese Technik für die folgenden Funktionen.
Objekterkennung
Sensitive Data Protection kann Objekte in Bildern klassifizieren und unkenntlich machen. Sie können Ihre Prüfungen beispielsweise so konfigurieren, dass sie Personalausweise mit Foto, Personen und Kfz-Kennzeichen in Bildern erkennen.
Wenn Sie Objekte in Bildern erkennen möchten, geben Sie in Ihrer Prüf- oder Entfernungsoperation Objekt infoTypes an.
Hier finden Sie weitere Informationen:
Sicherheitsklassifizierung von Bildern
Sensitive Data Protection kann Bilder anhand ihrer thematischen Inhalte klassifizieren und unkenntlich machen. Mit dieser Funktion können Sie Bilder identifizieren, die gemäß vordefinierten Sicherheitskategorien sensible oder schädliche Inhalte enthalten.
Der Schutz sensibler Daten analysiert den Gesamtkontext und die Bedeutung eines Bildes, um zu ermitteln, ob es zu Kategorien wie sexuell anstößige oder gewalttätige Inhalte gehört. Sie können diese Funktion verwenden, um die Inhaltsmoderation zu unterstützen und Richtlinien zur akzeptablen Nutzung durchzusetzen.
Bei der Sicherheitsklassifizierung von Bildern analysiert Sensitive Data Protection das gesamte Bild. Im Gegensatz zur Objekterkennung, bei der bestimmte Elemente in einem Bild identifiziert werden, wird bei dieser Funktion das Thema des Bildes als Ganzes bewertet. Wenn Sie das Entfernen von Daten basierend auf der Bildsicherheit konfigurieren, werden mit dieser Funktion alle Daten aus dem Bild entfernt.
Wenn Sie die Sicherheitsklassifizierung von Bildern durchführen möchten, geben Sie in Ihrer Prüf- oder Entfernungsoperation infoTypes für den Bildkontext an.
Einschränkungen für generierte Bilder
Die Modelle, die Sensitive Data Protection für die Sicherheitsklassifizierung von Bildern verwendet, werden hauptsächlich mit realen Bildern trainiert und bewertet. Obwohl diese Modelle einen gewissen Nutzen für die Analyse von KI-generierten Bildern bieten können, kann ihre Effektivität beim Erkennen aller Arten von richtlinienverletzenden Inhalten in KI-generierten Bildern variieren.
Wenn Sie infoTypes für den Bildkontext auf KI-generierte Bilder anwenden, werden die folgenden Inhalte möglicherweise nicht erkannt:
- Nuancierte oder subtile Inhalte
- Kontextabhängige Szenarien wie private Einstellungen
- Nicht explizite Darstellungen sensibler Themen
Die Leistung dieser Klassifikatoren bei KI-generierten Bildern entspricht möglicherweise nicht der Leistung bei natürlichen Bildern. Wir empfehlen Ihnen, gründliche Tests für Ihre spezifischen Anwendungsfälle für generative KI durchzuführen, um sicherzustellen, dass die Ergebnisse Ihren Sicherheitsanforderungen entsprechen. Verlassen Sie sich bei Sicherheitsgarantien in Anwendungen für generative KI mit hohem Risiko nicht ausschließlich auf diese Klassifikatoren.
Nächste Schritte
- Informationen zum Prüfen von Bildern auf sensible Daten mit Sensitive Data Protection
- Informationen zum Entfernen sensibler Daten aus Bildern mit dem Schutz sensibler Daten
- Informationen zum Erstellen einer de-identifizierten Kopie von Daten im Speicher