Descripción general de Cloud Storage

En esta página, se describe Cloud Storage y cómo funciona.

Cómo funciona Cloud Storage

Cloud Storage es un servicio de almacenamiento administrado y escalable que ofreceGoogle Cloud y que te permite almacenar datos como objetos en contenedores llamados buckets.

Todos los buckets están asociados a un proyecto que, a su vez, se puede agrupar en una organización. Después de crear un proyecto, puedes crear buckets, subir objetos a tus buckets y descargarlos. También puedes otorgar permisos para que tus datos sean accesibles para las principales que especifiques o para todos en la Internet pública. Las capacidades de directorio te permiten usar Cloud Storage de manera más similar a un disco duro o un almacenamiento conectado a la red (NAS): las carpetas te permiten organizar objetos en una estructura de directorio y las carpetas administradas te permiten simplificar el control de acceso a tus objetos.

Cada proyecto, bucket, objeto, carpeta y carpeta administrada es un recurso enGoogle Cloud, al igual que las instancias de Compute Engine.

La Google Cloud jerarquía

A continuación, te mostramos cómo puede aplicarse la estructura de Cloud Storage a un caso real:

  • Organización: Tu empresa, llamada Example Inc., crea una organización de Google Cloud llamada exampleinc.org.

  • Proyecto: Example Inc. compila varias aplicaciones y cada una está asociada a un proyecto. Cada proyecto tiene su propio conjunto de API de Cloud Storage, además de otros recursos.

  • Bucket: Cada proyecto puede contener varios buckets, que son contenedores para almacenar tus objetos. Por ejemplo, puedes crear un bucket photos para todos los archivos de imagen que genere tu app y un bucket videos separado. Cloud Storage ofrece diferentes clases de almacenamiento y ubicaciones para tus buckets, lo que te permite elegir la durabilidad y la disponibilidad de tus datos para satisfacer las necesidades de tus cargas de trabajo.

    Los buckets sirven como base de datos principal en el ecosistema más amplio de Google Cloud. Puedes conectar tus buckets como backends de almacenamiento para otros servicios deGoogle Cloud , como AI Hypercomputer, Vertex AI y Google Kubernetes Engine.

    Si bien los buckets son adecuados para la mayoría de los casos de uso de almacenamiento de datos, puedes configurar funciones y parámetros de configuración opcionales en un bucket para que sea más adecuado para cargas de trabajo de alto rendimiento específicamente:

    • Espacio de nombres jerárquico: Los buckets pueden tener habilitado el espacio de nombres jerárquico, lo que te permite almacenar tus datos en una estructura lógica de sistema de archivos con carpetas. Almacenar tus datos en carpetas te permite usar la semántica de directorios y las operaciones de carpetas atómicas, que a menudo son necesarias para acelerar las cargas de trabajo de IA/AA y Analytics con uso intensivo de datos. Los buckets con el espacio de nombres jerárquico habilitado ofrecen límites de consultas por segundo (QPS) iniciales hasta 8 veces más altos para leer y escribir objetos en comparación con los buckets sin el espacio de nombres jerárquico habilitado.

      El espacio de nombres jerárquico solo se puede habilitar en el momento de la creación del bucket y no se puede habilitar en un bucket existente.

    • Rapid Bucket: Rapid Bucket es una capacidad de alto rendimiento que te permite almacenar objetos en la clase de almacenamiento Rapid usando una zona como ubicación de un bucket. Cuando ubicas buckets en zonas, puedes colocar tus objetos junto con tus recursos de procesamiento, habilitar automáticamente el espacio de nombres jerárquico y usar nuevas APIs para lecturas de transmisión y escrituras anexables. Rapid Bucket proporciona una latencia, una capacidad de procesamiento y E/S significativamente mejorados en comparación con los buckets de otras clases de almacenamiento, lo que hace que la capacidad sea ideal para cargas de trabajo de IA/AA y análisis con uso intensivo de datos.

      Para usar Rapid Bucket, crea un bucket y define una zona como su ubicación. Rapid Bucket no se puede usar en buckets existentes que no se encuentren en una zona.

  • Objeto: Los buckets contienen objetos, como una imagen llamada puppy.png. Un objeto es un dato inmutable que consta de un archivo de cualquier formato. Cada bucket puede contener objetos individuales ilimitados.

  • Carpeta: Los buckets con espacio de nombres jerárquico habilitado pueden contener carpetas. Las carpetas habilitan un sistema de archivos real para almacenar objetos, a diferencia de un sistema de archivos simulado. Puedes cambiar el nombre de una carpeta y todos los objetos que contiene de forma atómica en una sola operación.

  • Carpeta administrada: Cada bucket también puede contener carpetas administradas que otorgan o revocan acceso adicional más allá de los permisos de IAM establecidos en el bucket. Las carpetas administradas no usan una verdadera estructura de árbol de directorios, sino que son una superposición de recursos que se usa solo para la verificación de permisos.

Herramientas para Cloud Storage

Puedes interactuar con Cloud Storage con las siguientes herramientas:

  • Consola deGoogle Cloud : La consola de Google Cloud proporciona una interfaz visual para que administres tus datos en un navegador.

  • Google Cloud CLI: La gcloud CLI te permite interactuar con Cloud Storage a través de una terminal con comandos de gcloud storage.

  • Bibliotecas cliente: Las bibliotecas cliente de Cloud Storage te permiten administrar tus datos con uno de tus lenguajes preferidos, incluidos C++, C#, Go, Java, Node.js, PHP, Python y Ruby.

  • APIs de REST: Administra tus datos con la API de JSON o XML.

  • Terraform: Terraform es una herramienta de infraestructura como código (IaC) que puedes usar para aprovisionar la infraestructura de Cloud Storage. Para obtener más información, consulta Aprovisiona recursos con Cloud Storage.

  • gRPC: gRPC te permite interactuar con Cloud Storage. gRPC es un framework de RPC universal de código abierto y alto rendimiento desarrollado por Google que puedes usar para definir tus servicios con búferes de protocolo.

  • Cloud Storage FUSE: Cloud Storage FUSE te permite activar los buckets de Cloud Storage en tu sistema de archivos local. Esto permite que las aplicaciones lean desde un bucket o escriban en un bucket con la semántica del sistema de archivos estándar.

Seguridad de los datos

Una vez que subas tus objetos a Cloud Storage, tendrás un control detallado sobre cómo proteger y compartir tus datos. Estas son algunas formas de proteger los datos que subes a Cloud Storage:

  • Identity and Access Management: Usa IAM para controlar quién tiene acceso a los recursos de tu proyecto de Google Cloud . Los recursos incluyen los objetos y buckets de Cloud Storage, además de otrasGoogle Cloud entidades, como las instancias de Compute Engine. Puedes otorgar a los principales ciertos tipos de acceso a buckets y objetos, como update, create o delete.

  • Encriptación de datos: Cloud Storage usa la encriptación del servidor para encriptar tus datos de forma predeterminada. También puedes usar opciones complementarias de encriptación de datos, como claves de encriptación administradas por el cliente y claves de encriptación proporcionadas por el cliente.

  • Autenticación: Asegúrate de que cualquier persona que acceda a tus datos tenga las credenciales adecuadas.

  • Borrar de forma no definitiva: Evita la pérdida permanente de datos contra la eliminación accidental o maliciosa reteniendo objetos y buckets borrados recientemente. De forma predeterminada, Cloud Storage habilita la eliminación no definitiva para todos los buckets con un período de retención de siete días.

  • Control de versiones de objetos: Cuando se reemplaza o borra una versión publicada de un objeto, puede retenerse como una versión no actual si habilitas el control de versiones de objetos.

  • Filtrado de IP del bucket: Con el filtrado de IP del bucket, puedes restringir el acceso a un bucket según la dirección IP de origen de la solicitud y proteger tus datos del acceso no autorizado desde direcciones IP o nubes privadas virtuales (VPC) específicas.

  • Bloqueo del bucket: Determina durante cuánto tiempo se deben retener los objetos en los buckets especificando una política de retención.

Nombres de recursos

Cada recurso tiene un nombre exclusivo que lo identifica, similar a un nombre de archivo. Los depósitos tienen un nombre de recurso con el formato projects/_/buckets/BUCKET_NAME, en el que BUCKET_NAME es el ID del depósito. Los objetos tienen un nombre de recurso con el formato projects/_/buckets/BUCKET_NAME/objects/OBJECT_NAME, en el que OBJECT_NAME es el ID del objeto.

Un #NUMBER agregado al final del nombre del recurso indica una generación específica del objeto. #0 es un identificador especial para la versión más reciente de un objeto. #0 es útil para agregar cuando el nombre del objeto termina en una string que, de otro modo, se interpretaría como un número de generación.

Guías de inicio rápido

Para conocer los aspectos básicos del uso de Cloud Storage, visita las siguientes guías:

¿Buscas otros productos?

Si Cloud Storage no es la solución de almacenamiento adecuada para ti, consulta más información sobre los siguientes servicios de almacenamiento:

  • Google Cloud Managed Lustre: Almacena tus datos en un sistema de archivos paralelos de alto rendimiento y completamente administrado que está optimizado para cargas de trabajo de IA y HPC.

  • Google Drive: Almacena, administra y comparte tus archivos personales.

  • Cloud Storage para Firebase: Administra los datos de tus aplicaciones para dispositivos móviles.

  • Persistent Disk: Agrega almacenamiento en bloque a tu máquina virtual de Compute Engine.

  • Filestore: Agrega almacenamiento de archivos para el acceso de multiescritura a tus clústeres de GKE.

  • Explora más servicios de almacenamiento que ofrece Google.

¿Qué sigue?