Acerca de la eliminación de objetos

Borrar los objetos que ya no necesitas te ayuda a reducir los costos de almacenamiento, cumplir con los requisitos de retención de datos y mantener organizados tus buckets. Según tus necesidades de escala y automatización, puedes elegir entre varios métodos para borrar objetos de forma manual, programática o a través de políticas automatizadas.

En esta página, se describen los métodos disponibles para borrar objetos de tus buckets y se te ayuda a elegir un método adecuado para tu tarea.

Para obtener información sobre cómo borrar objetos, consulta Borra objetos.

Borrado de un solo objeto

El borrado de un solo objeto proporciona un control preciso sobre datos específicos. Por lo general, borras objetos individuales cuando necesitas realizar actualizaciones inmediatas y segmentadas en los datos de tu bucket. Estos son algunos de los motivos comunes para borrar objetos individuales:

  • Corrección de errores: Quitar un archivo que se subió por accidente o que contiene datos incorrectos.

  • Limpieza: Quitar de forma manual archivos o registros temporales después de completar una tarea.

  • Lógica de la aplicación: Quitar automáticamente un archivo cuando realizas una acción en una aplicación, como borrar una foto de perfil.

  • Seguridad y cumplimiento: Borrar objetos como parte de la eliminación de información sensible.

Herramientas para borrar un solo objeto

Para borrar un solo objeto de tu bucket, usa cualquiera de las siguientes herramientas. Cada herramienta envía una solicitud DELETE individual por objeto.

Herramienta Descripción
Google Cloud console Borra un objeto a través de la Google Cloud console.
Google Cloud CLI Borra un objeto con el gcloud storage rm comando.
Bibliotecas cliente Borra un objeto de forma programática con un lenguaje compatible, como C++, C#, Go, Java, Node.js, PHP, Python o Ruby.
API de REST Borra un objeto con las APIs de REST de JSON y XML.

Borrado masivo de objetos

Los métodos de borrado masivo están diseñados para operaciones de alta eficiencia en conjuntos de datos grandes. Usa el borrado masivo para administrar los costos de almacenamiento y automatizar la higiene de datos en los buckets. Estos son algunos de los motivos comunes para borrar varios objetos:

  • Optimización de costos: Quitar conjuntos de datos grandes, como registros antiguos o artefactos de compilación temporales, que ya no son necesarios para las operaciones.

  • Automatización del cumplimiento: Aplicar automáticamente las políticas de retención de datos borrando objetos después de un período específico, por ejemplo, 30 días.

  • Migración o baja de buckets: Borrar millones o miles de millones de objetos cuando se migran datos o se cierra un proyecto.

  • Limpieza de canalizaciones de datos: Quitar archivos de procesamiento intermedio después de que se generó un informe o un conjunto de datos final.

Herramientas para borrar objetos de forma masiva

Para borrar objetos de forma masiva, usa una de las siguientes herramientas. Estos métodos están optimizados para obtener un mayor rendimiento y reducir la sobrecarga en comparación con las solicitudes individuales.

Herramienta Descripción
Borra varios objetos con la API de XML

Un método programático para borrar hasta 1,000 objetos en una sola solicitud POST. La API de XML de borrado de varios objetos está diseñada para ser interoperable con la API de Amazon S3. Como resultado, puedes usar tus herramientas, bibliotecas y flujos de trabajo existentes de Amazon S3 para administrar objetos en Cloud Storage. La API de XML es útil si migras datos o administras recursos en ambas plataformas.

Cuando se usa la API de XML para borrar varios objetos, Cloud Storage genera registros de auditoría de acceso a datos. Estos registros incluyen detalles sobre la solicitud general y los borrados de objetos individuales, siempre que habilites los registros de auditoría de acceso a datos. Para obtener más información, consulta Registros de auditoría para la API de XML de borrado de varios objetos.

La API de XML de borrado de varios objetos tiene las siguientes limitaciones:

  • Omisión del modo de administración: Cloud Storage no admite la omisión del modo de administración durante ningún borrado, a diferencia de Amazon S3, que permite borrar objetos bloqueados por tipo de administración especificando el encabezado x-amz-bypass-governance-retention. Cloud Storage aplica políticas de retención de objetos para ayudar con la inmutabilidad de los datos.
  • Marcadores de borrado: Los marcadores de borrado de Amazon S3 no son compatibles con Cloud Storage para borrados de objetos individuales o múltiples. Para restablecer un objeto no actual en Cloud Storage, es necesario usar solicitudes PUT para copiar la versión requerida en el objeto publicado.
  • Borrado condicional: La API de borrado de varios objetos de Cloud Storage no admite borrados condicionales basados en ETag, Last-Modified, o Size. Las solicitudes que incluyen estos parámetros generan un error 400. Para las operaciones condicionales en Cloud Storage, usa encabezados como x-goog-if-generation-match o x-goog-if-metageneration-match.
Google Cloud console La Google Cloud console es una opción recomendada cuando se borran hasta un millón de objetos. Después de iniciar una solicitud de borrado, el proceso se realiza en segundo plano. Para comprobar el estado del borrado masivo, haz clic en el botón Notificaciones () en el Google Cloud encabezado de la console.
Storage batch operations

Un servicio completamente administrado que realiza borrados basados en un archivo de manifiesto. Adecuado para borrar hasta miles de millones de objetos con seguimiento y reintentos integrados.

Recomendamos usar operaciones por lotes de almacenamiento si deseas hacer lo siguiente:

  • Borrar millones o miles de millones de objetos
  • Mejorar la confiabilidad con el seguimiento, los reintentos y el manejo de errores integrados
  • Reducir la sobrecarga del cliente en comparación con la secuencia de comandos de llamadas a la API individuales
gcloud storage rm --recursive Un comando de Google Cloud CLI para borrar todos los objetos que comparten un prefijo común. Adecuado para tareas masivas de pequeña a mediana escala con la CLI.
Administración del ciclo de vida de los objetos Una función del servidor que borra objetos automáticamente según las reglas que definas, como la antigüedad del objeto o la clase de almacenamiento. Para borrar objetos de forma masiva en tu bucket, establece en él una regla de configuración del ciclo de vida en el que la condición tenga Age establecido en 0 y la acción esté configurada en delete. Una vez que configuras la regla, Cloud Storage realiza el borrado masivo de forma asíncrona.
Solicitudes en lotes Cuando usas ciertas bibliotecas cliente o la API de JSON directamente, puedes agrupar en lotes tus solicitudes de borrado para reducir la cantidad de conexiones HTTP que necesitas.

Elige un método de borrado

La herramienta para borrar objetos depende de la cantidad de objetos que necesitas borrar y del motivo. Usa la siguiente guía para elegir un método para tu caso de uso:

  • Si necesitas borrar uno o solo algunos objetos específicos, usa la Google Cloud consola, gcloud storage rm, o llamadas a la API individuales con bibliotecas cliente o APIs de REST. Para obtener más información, consulta Borra un solo objeto.
  • Si necesitas borrar hasta 1,000 objetos en una sola solicitud a la API, usa la API de XML de borrado de varios objetos, la CLI de Amazon S3 o una biblioteca cliente compatible con S3, como Boto3. Para obtener más información, consulta Borra objetos de forma masiva.
  • Si borras muchos objetos que comparten un prefijo de nombre común, usa el comando gcloud storage rm --recursive. Para obtener más información, consulta Borra objetos de forma masiva con Google Cloud CLI.
  • Si necesitas borrar millones o miles de millones de objetos, usa operaciones por lotes de almacenamiento para borrados confiables a gran escala.
  • Si necesitas borrar objetos automáticamente cuando cumplen con ciertos criterios, usa la Administración del ciclo de vida de los objetos.

¿Qué sigue?