Protección de Datos Sensibles contiene muchos detectores de infoType integrados, pero también puedes crear los tuyos. Puedes personalizar el comportamiento de detección definiendo tus propios detectores de infoType personalizados para que Protección de Datos Sensibles inspeccione o desidentifique los datos sensibles que coincidan con los patrones que especifiques. Estos son los tipos de detectores de infoType personalizados:
- Los detectores de diccionario personalizado normales son listas sencillas de palabras y frases que Sensitive Data Protection busca. Usa detectores de diccionario personalizado normales cuando tengas como máximo varios cientos de miles de palabras.
- Sensitive Data Protection genera detectores de diccionarios personalizados grandes a partir de listas grandes de palabras o frases almacenadas en Cloud Storage o BigQuery. Usa detectores de diccionarios personalizados grandes cuando tengas una lista extensa de palabras o frases (hasta decenas de millones).
- Los detectores de expresiones regulares (regex) permiten a Protección de datos sensibles detectar coincidencias basadas en un patrón de expresión regular.
- Los detectores de infoType sustituto detectan la salida de la transformación de desidentificación de Protección de Datos Sensibles
CryptoReplaceFfxFpeConfig
. Este detector de infoType personalizado solo se usa con el métodocontent:reidentify
para revertir la desidentificación mediante el encriptado con preservación de formato (FPE) en el modo FFX. Por este motivo, los sustitutos no se describen en detalle en estos temas. Para obtener más información sobre cómo y cuándo usar detectores de infoType personalizados subrogados, consulta Pseudonimización.
Además, Protección de Datos Sensibles incluye el concepto de reglas de inspección, que te permiten ajustar los resultados de los análisis mediante lo siguiente:
- Las reglas de exclusión le permiten excluir resultados falsos o no deseados añadiendo reglas a un detector de infoType integrado o personalizado.
- Las reglas de palabras de activación te permiten aumentar la cantidad o la precisión de los resultados que se devuelven añadiendo reglas a un detector de infoTypes integrado o personalizado.
Para obtener más información sobre los detectores personalizados de InfoType, consulta la página de conceptos InfoTypes y detectores de infoType. Para ver varios ejemplos que puedes usar o modificar según te convenga, consulta Ejemplos de detectores de infoType personalizados. En el resto de este tema se describe cómo usar Protección de Datos Sensibles para crear tus propios detectores de InfoType personalizados.
Dónde usar detectores de infoType personalizados
Los detectores de infoType personalizados se definen en el objeto
CustomInfoType
. Especifica un CustomInfoType
en el objeto InspectConfig
cuando configuras lo siguiente:
- Inspección con
projects.content.inspect
. - Tareas de inspección en
InspectJobConfig
. - Plantillas de inspección en
InspectTemplate
. - Desidentificación mediante
projects.content.deidentify
. - Plantillas de desidentificación en
DeidentifyTemplate
. - Volver a identificar contenido que se ha desidentificado con FPE en modo FFX
mediante
projects.content.reidentify
. Este caso se aplica específicamente a los detectores de infoType personalizados sustitutos.
Información general sobre la API
El objeto
CustomInfoType
te permite crear un detector de infoType personalizado para contenido nuevo o
ajustar los resultados devueltos por los detectores de infoType predefinidos.
El objeto CustomInfoType
se compone de los siguientes campos, que se definen como se describe:
"infotype"
: nombre del detector de infoType personalizado, contenido en un objetoInfoType
."likelihood"
: valor predeterminado deLikelihood
que se devuelve para este detector de infoType personalizado. Puedes especificar valoresLikelihood
alternativos en"detectionRules"
que sustituirán a este valor baseLikelihood
si el resultado cumple los criterios especificados en la regla. Si no incluyes el campo"likelihood"
, el detector de infoType personalizado se asignará de forma predeterminada aVERY_LIKELY
. Para obtener más información sobre la probabilidad, consulta la página de conceptos sobre la probabilidad."detectionRules"
: conjunto de objetosDetectionRule
que se aplicarán adicionalmente a todos los resultados de este detector de infoType personalizado. Aquí es donde se especifican las reglas de palabras de activación como objetosHotwordRule
. Las reglas se aplican en el orden en que se especifican. Este campo no se aplica a los objetosSurrogateType
."sensitivityScore"
: el valor deSensitivityScore
que se devolverá para este detector de infoType personalizado. Si no incluye el campo"sensitivityScore"
, el detector de infoType personalizado tendrá el valor predeterminadoVERY_LIKELY
.Las puntuaciones de sensibilidad se usan en los perfiles de datos. Al crear perfiles de tus datos, Protección de Datos Sensibles usa las puntuaciones de sensibilidad de los infoTypes para calcular el nivel de sensibilidad.
Uno de los siguientes campos, en función del tipo de detector de InfoType personalizado que estés creando:
"dictionary"
: objetoDictionary
que contiene una lista de palabras o frases que se deben buscar."regex"
: objetoRegex
que contiene un único patrón que define la expresión regular."surrogateType"
: un objetoSurrogateType
que, si está presente, indica que el detector de infoType personalizado es un sustituto. Para obtener más información sobre cómo usar detectores de infoTypes personalizados subrogados, consulte Pseudonimización."storedType"
: referencia a un objetoStoredInfoType
. Este campo es obligatorio al crear un detector de diccionario personalizado grande. Aunque puedes crear detectores de diccionario normales o detectores de expresiones regulares definiendo este campo, es más sencillo crearlos definiendo el campodictionary
o el camporegex
, respectivamente.
Pasos siguientes
Consulta más información sobre cómo crear infoTypes personalizados en los siguientes temas:
- Crear un detector de diccionario personalizado normal: consulta cómo crear un detector de InfoType personalizado para que coincida con los resultados de una lista de palabras y frases.
- Crear un detector de diccionario personalizado grande: Consulta cómo buscar coincidencias en una lista muy grande de palabras y frases. Los detectores de infoType personalizados almacenados pueden coincidir con hasta decenas de millones de palabras.
- Crear un detector personalizado de expresiones regulares: consulta cómo crear un detector personalizado de InfoType para que coincida con los resultados de una expresión regular.
- Modificar los detectores de infoType para acotar los resultados del análisis: consulta cómo crear modificadores para los detectores de infoType integrados y personalizados que pueden acotar los resultados del análisis.
- Personalizar la probabilidad de coincidencia: consulta cómo usar reglas de detección y palabras clave activadoras para personalizar los valores de probabilidad que se asignan a las coincidencias de detectores personalizados.
- Ejemplos de detectores de infoType personalizados: varias definiciones de detectores de infoType personalizados en formato JSON que puedes usar o modificar según tus necesidades.