En esta página, se describe el descubrimiento de Sensitive Data Protection para usar con Vertex AI.
El descubrimiento de Sensitive Data Protection te ayuda a obtener información sobre los datos incluidos en tus conjuntos de datos de entrenamiento y trabajos de ajuste de Vertex AI. El descubrimiento genera perfiles de datos que proporcionan estadísticas, como los tipos de información (infoTypes) detectados y el nivel de sensibilidad de los datos que usas para entrenar y ajustar modelos.
Beneficios
Esta función ofrece los siguientes beneficios:
- Puedes supervisar tus conjuntos de datos y trabajos de ajuste de Vertex AI (a nivel de la organización, la carpeta o el proyecto) para detectar datos sensibles y generar informes sobre los resultados.
- Si el descubrimiento detecta datos sensibles de entrenamiento o ajuste, puedes usar los perfiles de datos para identificar qué recursos deben investigarse más a fondo. Puedes realizar una inspección profunda y encontrar todas las instancias sensibles en un recurso.
- Puedes enviar los resultados del descubrimiento a Security Command Center para que se tengan en cuenta tus cargas de trabajo relacionadas con la IA que contienen datos potencialmente sensibles cuando evalúes la postura de seguridad de tu organización.
Fuente de datos compatible
Esta función puede crear perfiles de los siguientes tipos de datos a los que se hace referencia en tus conjuntos de datos y trabajos de ajuste de Vertex AI:
- Datos de entrenamiento y ajuste en buckets de Cloud Storage Para obtener información sobre los tipos de archivos compatibles, consulta Clústeres de archivos.
- Datos de entrenamiento en tablas de BigQuery
Cómo funciona
Cuando generas el perfil de un conjunto de datos de Vertex AI, la Protección de datos sensibles genera un perfil de datos de almacén de archivos o un perfil de datos de tabla, según dónde se almacenen los datos de entrenamiento: un bucket de Cloud Storage o una tabla de BigQuery.
Cuando generas un perfil de un trabajo de ajuste de Vertex AI, la Protección de datos sensibles genera un perfil de datos de almacén de archivos.
Un perfil de datos proporciona estadísticas y metadatos sobre el recurso para el que creaste el perfil. Para cada conjunto de datos o trabajo de ajuste de Vertex AI, el perfil de datos generado incluye la siguiente información.
- Los niveles de sensibilidad y riesgo de datos de los datos de entrenamiento o ajuste
- Los tipos de información sensible que se encuentran en los datos de entrenamiento o ajuste, por ejemplo, IDs de licencias de conducir y direcciones de correo electrónico
Para obtener una lista completa de las estadísticas y los metadatos en cada perfil de datos de almacén de archivos, consulta Perfiles de datos de almacén de archivos.
Para obtener una lista completa de las estadísticas y los metadatos en cada perfil de datos de la tabla, consulta Perfiles de datos de la tabla.
Para obtener más información sobre el servicio de descubrimiento, consulta Perfiles de datos.
Precios
Cuando generas perfiles de datos, se aplican cargos de Sensitive Data Protection según el modelo de precios de descubrimiento que elijas.
Además, si tus datos de entrenamiento o ajuste se encuentran en un bucket de Cloud Storage, Cloud Storage te cobrará por las solicitudes que realiza Protección de datos sensibles para generar perfiles de los datos. En las siguientes secciones, se describen los cargos asociados de Cloud Storage en los que incurres.
Operaciones de clase B
Se te cobra por las operaciones de clase B (storage.buckets.get) que realiza la Protección de datos sensibles en el proceso de generación de perfiles de datos en tus buckets de Cloud Storage.
Para obtener información sobre cuánto cobra Cloud Storage por las operaciones de clase B, consulta Cargos por operación en la documentación de Cloud Storage.
Tarifas de recuperación
En el caso de los objetos que tienen una clase de almacenamiento que no es Standard, se te cobran tarifas de recuperación. Para obtener información sobre cuánto cobra Cloud Storage por la recuperación de datos, consulta Tarifas de recuperación en la documentación de Cloud Storage.
¿Qué sigue?
- Genera perfiles de datos de Vertex AI en un solo proyecto
- Genera perfiles de datos de Vertex AI en una organización o carpeta