Rapid Cache

En esta página, se describe Rapid Cache, una función que proporciona una caché de lectura zonal respaldada por SSD para los buckets de Cloud Storage, lo que te permite obtener más capacidad de procesamiento y menor latencia en tus datos almacenados. Rapid Cache proporciona capacidad de almacenamiento y ancho de banda que se ajustan automáticamente según tus necesidades.

Debido a sus beneficios, Rapid Cache es útil para mejorar el rendimiento y reducir los costos de red asociados con las cargas de trabajo con muchas lecturas.

Consulta Crea y administra cachés para obtener información sobre cómo crear y administrar cachés en Rapid Cache.

¿Cómo funciona?

Rapid Cache te permite crear cachés en la misma zona que tus cargas de trabajo. Cuando creas una caché en una zona, la caché procesa las solicitudes de lectura de datos que se originan en la zona en lugar del bucket. Cada caché atiende a los clientes que se encuentran en la misma zona que la caché. Los datos solo se transferirán a la caché desde tu bucket cuando una VM que resida en la misma zona que la caché lea esos datos. Además, los datos se pueden transferir cuando se escriben en tu bucket si configuras la opción transferir en escritura. Los metadatos no se almacenan en caché, y el bucket procesa las solicitudes de metadatos de objetos en lugar de la caché.

Rapid Cache es un servicio completamente administrado que siempre devuelve datos coherentes.

Ajuste de escala automático del tamaño de la caché y del límite de ancho de banda

Rapid Cache proporciona capacidad de almacenamiento y ancho de banda temporales que se ajustan automáticamente según la cantidad de datos almacenados en una caché.

El límite de ancho de banda de la caché comienza en 100 Gbps y se ajusta a una velocidad de 20 Gbps por cada 1 TiB de datos almacenados. Puedes aumentar el ancho de banda inicial o el límite de ancho de banda total si aumentas la cantidad de datos almacenados en la caché, creas más cachés en una zona o te comunicas con tu administrador técnico de cuentas o representante de Google.

Para obtener más información sobre los límites de tamaño y ancho de banda de Rapid Cache, consulta Cuotas y límites de Cloud Storage.

Almacenamiento de datos en caché en zonas

Cuando creas una caché para un bucket, esta debe crearse en una zona dentro de la ubicación del bucket. Por ejemplo, si tu bucket se encuentra en la región us-east1, puedes crear una caché en us-east1-b, pero no en us-central1-c. Si tu bucket se encuentra en la región doble ASIA, puedes crear una caché en cualquiera de las zonas que conforman las regiones asia-east1 y asia-southeast1.

Para cada bucket, puedes crear un máximo de una caché por zona. Por ejemplo, si un bucket se encuentra en la región us-east1, puedes crear una caché en us-east1-b y otra en us-east1-c. Si un bucket se encuentra en una región múltiple que abarca us-central1 y us-east1, puedes crear una caché en us-central1-a y otra en us-east1-b.

Puedes crear cachés en zonas siempre que haya capacidad disponible para la zona. Si la capacidad para crear una caché no está disponible, Rapid Cache seguirá intentando crear una caché hasta que la capacidad esté disponible o el usuario cancele el proceso de creación. Es posible que la capacidad no esté disponible durante un período prolongado.

Puedes usar Rapid Cache en las siguientes zonas. Estas zonas se pueden usar según el tipo de ubicación de tu bucket.

Área geográfica Ubicación
Nombre de la zona Región Birregional Multirregión Región doble personalizada
Asia
asia-east1-a
asia-east1-b
asia-east1-c
asia-northeast1-a
asia-northeast1-b
asia-northeast1-c
asia-south1-a
asia-south1-b
asia-south1-c
asia-southeast1-a
asia-southeast1-b
asia-southeast1-c
Europa
europe-north1-a
europe-north1-b
europe-north1-c
europe-west1-b
europe-west1-c
europe-west1-d
europe-west4-a
europe-west4-b
europe-west4-c
europe-west6-a
europe-west6-b
Estados Unidos
us-central1-a
us-central1-b
us-central1-c
us-central1-f
us-central1-ai1a (Zona de IA)
us-east1-b
us-east1-c
us-east1-d
us-east4-a
us-east4-b
us-east4-c
us-east5-a
us-east5-b
us-east5-c
us-south1-a
us-south1-b
us-south1-c
us-south1-ai1b (Zona de IA)
us-west1-a
us-west1-b
us-west1-c
us-west3-a
us-west3-b
us-west3-c
us-west4-a
us-west4-b
us-west4-c

Transferencia de datos

Los datos siempre se transfieren a la caché una vez que se accede a ellos por primera vez desde un bucket. La primera lectura se entrega como una error de caché y las lecturas posteriores se entregan como aciertos de caché, lo que acelera las lecturas de datos. De manera opcional, puedes configurar una caché para ingerir datos en la escritura y evitar la falta inicial de caché. Esto beneficia casos de uso como la restauración de puntos de control o la preparación de canalizaciones de datos para entrenar modelos.

Cuando se transfieren datos a una caché, Rapid Cache divide los objetos en fragmentos más pequeños de tamaño fijo. Dividir los objetos en fragmentos permite un almacenamiento en caché más granular, en especial para los archivos grandes en los que solo se accede a partes específicas.

Un fragmento es un bloque de datos de 2 MB. Cuando se realiza una solicitud para un objeto, Rapid Cache identifica qué fragmentos de 2 MB abarcan el rango de bytes solicitado y administra esos fragmentos de forma independiente.

El comportamiento de la transferencia de datos difiere según el tamaño del objeto que se transfiere a la caché:

  • En el caso de las solicitudes de lectura de objetos de más de 2 MB, solo se transfieren los fragmentos que contienen el rango de bytes solicitado. Por ejemplo, si lees el primer MB de un archivo de 100 MB, solo se transferirá el primer fragmento de 2 MB.

  • En el caso de las solicitudes de lectura de objetos de menos de 2 MB (por ejemplo, una imagen de 500 KB), se incorpora todo el objeto a la caché.

Configuración de caché

Puedes establecer las siguientes propiedades cuando configures una caché:

Tiempo de actividad (TTL)

El TTL es el tiempo más largo que un fragmento de datos permanecerá en la caché desde la última lectura. Por ejemplo, si el TTL se establece en 24 horas, un fragmento de datos que se leyó por última vez a las 11 a.m. del lunes sin lecturas posteriores se quitará de la caché a las 11 a.m. del martes. Puedes establecer un TTL entre 24 horas y 7 días. Si no se especifica, el TTL predeterminado es de 24 horas.

Transferir en la escritura

La transferencia de datos a la caché en la escritura de objetos acelera las cargas de trabajo de lectura después de escritura, como la verificación de puntos de control y la salida de la preparación de datos para un trabajo de entrenamiento. Cuando configuras una caché para transferir datos en la escritura, los datos se escriben en la caché a medida que se suben al bucket. Este enfoque proactivo elimina las fallas iniciales de la caché y permite que tus cargas de trabajo se beneficien de un acierto inmediato de la caché en la primera lectura.

La opción de incorporación en escritura se puede habilitar de forma opcional cuando actualizas los criterios de incorporación de una caché existente. No se puede configurar durante la creación inicial de la caché.

Consideraciones de rendimiento

  • Faltas de fragmentos: Si una solicitud abarca varios fragmentos y algunos están en la caché, mientras que otros no, Rapid Cache recupera de forma transparente los fragmentos faltantes del bucket de origen.

  • TTL y expulsión: Las políticas de expulsión de tiempo de actividad (TTL) y de uso menos reciente (LRU) también operan en fragmentos. Las partes de uso frecuente de un archivo grande pueden permanecer en la caché, mientras que las partes de uso poco frecuente se descartan.

Precios

Para obtener información sobre los precios de Rapid Cache, consulta Precios de Rapid Cache.

Controles de costos

Expande las siguientes sugerencias para obtener información sobre cómo minimizar los costos de ejecutar cachés:

Selección de bucket

Solo debes crear cachés para los buckets que contengan datos que quieras almacenar en caché.

Selección de la zona

Solo debes crear cachés en las zonas en las que tu carga de trabajo se beneficiará del almacenamiento en caché.

Configuración del TTL

Debes especificar el TTL mínimo que necesitas para almacenar datos en la caché. El TTL se puede cambiar sin interrupciones. El valor predeterminado es 1 día.

Cómo inhabilitar la caché

Puedes inhabilitar una caché para quitarla de forma permanente del servicio y evitar que se acumulen las tarifas asociadas a la caché.

Beneficios

Cuando almacenas en caché tus datos con Rapid Cache, obtienes los siguientes beneficios:

  • Obtén acceso más rápido a los datos: Rapid Cache ubica tus datos en la misma zona que tus recursos de procesamiento y está respaldado por completo por SSD. Esto permite que tus cargas de trabajo alcancen una capacidad de procesamiento de hasta 2.5 TB/s y reduce la latencia para lecturas más rápidas.

  • Reduce las tarifas de transferencia de datos multirregionales: Los datos que se leen desde la caché se cobran con tarifas de transferencia de datos reducidas en comparación con los datos que se leen directamente desde un bucket multirregional.

  • Reducir las tarifas de recuperación: Las tarifas de recuperación para los buckets en Nearline Storage, Coldline Storage y Archive Storage no se aplican a las lecturas de datos desde la caché.

  • Acumula costos más bajos por las operaciones de lectura: Las operaciones de lectura que se entregan desde la caché rápida tienen un precio más bajo que las operaciones de clase B que se entregan desde un bucket en el almacenamiento estándar.

  • Ajusta automáticamente el tamaño de tu caché: El almacenamiento en caché dinámico de SSD de Rapid Cache se ajusta automáticamente según el uso, sin que tengas que especificar un tamaño de caché.

  • Usa las cachés de manera eficiente: Rapid Cache se puede habilitar en buckets existentes sin necesidad de cambiar tus aplicaciones o APIs existentes. Los datos almacenados en Rapid Cache tienen coherencia sólida.

Para obtener detalles sobre los precios, consulta Precios de Rapid Cache. Para obtener información sobre las cuotas, consulta Cuotas de Rapid Cache.

¿Cuándo deberías usar Rapid Cache?

Usa Rapid Cache para los datos que cambian con poca frecuencia y se leen con frecuencia para acelerar las lecturas de datos en las cargas de trabajo de análisis y el entrenamiento y la carga de modelos de IA/AA.

Supongamos que entrenas un modelo de IA en muchos nodos de Google Kubernetes Engine, todos ellos leen repetidamente datos almacenados en tus buckets de Cloud Storage y se ejecutan en la misma zona. Cuando creas una caché en la zona en la que se ejecuta tu carga de trabajo, la caché proporciona ancho de banda adicional y te ayuda a reducir las tarifas por transferencia de datos asociadas con la lectura de datos en buckets multirregionales, lo que te permite ejecutar cargas de trabajo más grandes y escaladas de manera más eficiente.

Cómo usar Rapid Cache para acelerar las lecturas de BigQuery

Rapid Cache se puede usar para entregar datos para las solicitudes de lectura de objetos que emite BigQuery. Con Rapid Cache, puedes acelerar las lecturas de datos para tus aplicaciones y, al mismo tiempo, optimizar la eficiencia de costos.

Si bien BigQuery es un servicio regional, sus recursos de procesamiento subyacentes pueden cambiar ocasionalmente entre zonas para el balanceo de cargas. Como práctica recomendada, habilita Rapid Cache para una carga de trabajo de BigQuery en todas las zonas de una región para garantizar que haya una caché disponible para usar en caso de que los recursos de procesamiento subyacentes cambien de zona. Si no se usa una caché en una zona, no se incurre en costos adicionales, ya que Rapid Cache se paga por uso. Ten en cuenta que, si los recursos de una carga de trabajo cambian de zona, la caché de la nueva zona deberá volver a transferir los datos, lo que podría generar un aumento único en los costos de transferencia de datos.

Recomendador de Rapid Cache

El recomendador de Rapid Cache proporciona recomendaciones y estadísticas para crear cachés en pares de zonas de bucket analizando tu uso y almacenamiento de datos. Para obtener información general y las instrucciones para usar el recomendador de Rapid Cache, consulta Recomendador de Rapid Cache.

Operaciones de caché

En esta sección, se describen las operaciones que puedes realizar en las cachés de Rapid Cache. Algunas operaciones son asíncronas y devuelven una operación de larga duración, mientras que otras son síncronas, en las que las operaciones se realizan de inmediato y devuelven un recurso de AnywhereCache.

Crea una caché

Cuando creas una caché, esta entra en el estado CREATING mientras se crea y, luego, entra en el estado RUNNING cuando comienza a ejecutarse de forma activa. La operación de creación de caché puede tardar hasta 48 horas, después de lo cual se agotará el tiempo de espera.

La API de AnywhereCaches Create es asíncrona. Una operación de creación hace que se muestre una operación de larga duración. La operación de larga duración proporciona un estado de la operación de creación y te permite cancelarla antes de que se complete.

Actualiza una caché

Puedes actualizar el TTL o el comportamiento de la transferencia de una caché en estado RUNNING. Cuando se está actualizando una caché, el campo pending_update se evalúa como true. Mientras el campo pending_update se evalúa como true, no se puede volver a actualizar la caché.

No se puede actualizar una caché en estado CREATING o DISABLED. La API de AnywhereCaches Update es asíncrona y devuelve una operación de larga duración.

Cuando finaliza la actualización del TTL de una caché, el nuevo TTL se aplica de inmediato a los datos existentes y nuevos de la caché.

Obtén una caché

Cuando obtienes una caché, Rapid Cache devuelve el estado y la configuración de la instancia de caché. La API de Get de AnywhereCaches es síncrona y devuelve un recurso de AnywhereCache.

Enumera cachés

Puedes devolver una lista de las cachés asociadas para un bucket determinado. La API de AnywhereCaches List es síncrona y admite la paginación.

Inhabilita una caché

Puedes inhabilitar una caché para quitarla de forma permanente de la configuración de tu bucket. Cuando inhabilitas una caché, esta entra en el estado DISABLED. Durante este estado, puedes seguir leyendo los datos existentes de la caché, pero no puedes transferir datos nuevos a ella.

Después de inhabilitar una caché, hay un período de gracia de 1 hora durante el cual puedes cancelar la inhabilitación reanudando la caché. Después de este período de gracia de 1 hora, se borra la caché. Cuando se borra la caché, se quitan todos los datos que contiene y se quita del bucket.

Durante el período de 1 hora anterior a la eliminación de la caché, puedes revertir el estado DISABLED reanudando la caché, momento en el que se reanuda en el estado RUNNING.

La API de AnywhereCaches Disable es síncrona y devuelve un recurso de AnywhereCache.

Cómo reanudar una caché

Puedes reanudar las cachés que se encuentran en estado DISABLED, siempre y cuando la caché inhabilitada esté dentro del período de gracia de 1 hora. Después del período de gracia de 1 hora, la operación de reanudación se realiza con el mayor esfuerzo posible, ya que la caché se puede borrar en cualquier momento después del período de gracia. Una vez que se reanuda una caché, esta entra en el estado RUNNING.

La API de AnywhereCaches Resume es síncrona y devuelve un recurso de AnywhereCache.

Limitaciones y restricciones

  • Para borrar un bucket, primero debes borrar todas las cachés asociadas. La única excepción es cuando se borra un bucket con la consola de Google Cloud , que borra todas las memorias caché asociadas junto con el bucket.

  • Cuando realices las operaciones de creación, inhabilitación, reanudación o actualización de la caché, limita la frecuencia de las operaciones a no más de una operación por segundo. Realizar más de una operación por segundo puede provocar errores.

  • Rapid Cache no es un almacenamiento duradero, y los datos se pueden expulsar de la caché en varias situaciones. Una situación es cuando la caché cambia de tamaño automáticamente para garantizar que haya recursos suficientes disponibles para tus cargas de trabajo. En esta situación, es posible que algunos datos se descarten según un algoritmo de elementos usados menos recientemente (LRU) hasta que el servicio de Rapid Cache termine de aumentar el tamaño de la caché.

    En cualquier caso, tus datos permanecerán almacenados de forma segura en tu bucket de origen. Cuando los datos se descartan de la caché por motivos distintos al vencimiento del TTL, el servicio de Rapid Cache intentará volver a transferir los datos a la caché de forma transparente y sin costo para ti. Si los datos no se pueden volver a transferir de forma transparente o se descartaron debido al vencimiento del TTL, el servicio de Rapid Cache los volverá a transferir en la primera lectura.

  • Las recomendaciones y las estadísticas que genera el recomendador de Rapid Cache no se pueden leer con BigQuery.

Soluciona problemas de escasez de recursos temporales

En las siguientes secciones, se describe cómo solucionar problemas cuando se produce una escasez temporal de recursos, en la que no hay suficiente capacidad de SSD o capacidad de procesamiento en una zona especificada para crear una caché, aumentar el tamaño de una caché o aumentar el límite de ancho de banda de una caché.

No se pudo crear una caché nueva

Es posible que Rapid Cache no pueda crear una nueva caché en una zona específica debido a la falta de capacidad de SSD o de recursos de procesamiento, lo que genera una escasez temporal de recursos. Durante este período, Rapid Cache intenta crear la nueva caché por hasta 48 horas. Si los recursos están disponibles dentro del plazo de 48 horas, Rapid Cache completará correctamente la solicitud de creación de caché. Si los recursos no están disponibles en un plazo de 48 horas, la solicitud de creación de caché falla.

Cómo solucionar problemas: Para evitar interrupciones en el almacenamiento en caché, puedes cancelar manualmente la operación de creación de caché y crear una nueva en una zona diferente que podría tener capacidad disponible. Para supervisar o cancelar una operación de creación de caché, consulta cómo usar operaciones de larga duración.

No se pudo aumentar el tamaño de la caché

Rapid Cache no puede aumentar el tamaño de una caché cuando la cantidad requerida de capacidad de SSD no está disponible en la zona de la caché.

Si bien Rapid Cache ofrece aumentos automáticos del tamaño de la caché a pedido, estos aumentos dependen de la disponibilidad de capacidad de SSD. Si la capacidad de SSD no está disponible cuando se realiza la solicitud de aumento automático del tamaño de la caché, Rapid Cache seguirá enviando la solicitud hasta que finalice la escasez temporal de recursos o ya no sea necesario aumentar el tamaño de la caché.

Durante una escasez temporal de recursos, se incorporan datos nuevos y se expulsan los datos existentes de la caché según el uso menos reciente. Las cachés que son lo suficientemente grandes como para almacenar la mayoría de los datos activos no experimentan un impacto significativo en las métricas de caché. Las cachés con menos capacidad que la cantidad de datos activos pueden expulsar datos y volver a incorporarlos con más frecuencia que las cachés que no se ven afectadas por la escasez de recursos. Cuando el tamaño real de la caché es mucho menor que la capacidad necesaria, es posible que experimentes el siguiente comportamiento relacionado con la escasez de recursos:

  • Un límite de ancho de banda de caché más bajo, una capacidad de procesamiento de caché más baja, un mayor consumo de la cuota de ancho de banda de transferencia de datos y un posible impacto en otras métricas
  • La facturación podría verse afectada de las siguientes maneras:
    • Aumento de los costos debido a la tarifa de transferencia de la caché
    • Disminución de los costos por la tarifa de almacenamiento en caché
    • Disminución de los costos por la tarifa de transferencia de datos de caché
    • Disminución de los costos por las tarifas de operación de transferencia de datos de la caché
    • Aumento de los costos debido a la tarifa de transferencia de datos multirregión
    • Aumento de los costos por el uso de operaciones de clase B

Para obtener información sobre estas comisiones, consulta Precios de Rapid Cache.

Cómo solucionar problemas: Para obtener los mejores resultados durante una escasez temporal de recursos, te recomendamos que supervises tus cachés y que inhabilites las cachés o las cargas de trabajo innecesarias según tus necesidades.

No se pudo aumentar el límite de ancho de banda de una caché

La falta de límite de ancho de banda de la caché puede ocurrir de forma temporal durante un aumento del tamaño de la caché cuando los recursos de entrega de capacidad de procesamiento en una zona específica no son suficientes para escalar el límite de ancho de banda de la caché de las cachés existentes a 20 Gbps por TiB. Durante una escasez de ancho de banda de caché disponible, Rapid Cache no permite que el límite de ancho de banda de caché se escale a 20 Gbps por TiB de datos, pero la caché sigue atendiendo las solicitudes de lectura. Para solicitar más ancho de banda de caché, comunícate con tu administrador técnico de cuentas o con un representante de Google. Durante una escasez de ancho de banda de caché disponible, es posible que observes un aumento en el consumo de ancho de banda de salida de datos de tu bucket.

Cómo solucionar problemas: Para obtener los mejores resultados durante una escasez temporal de recursos, te recomendamos que supervises tus cachés y que inhabilite las cachés o las cargas de trabajo innecesarias según tus necesidades.

¿Qué sigue?