Descripción general del almacenamiento en caché en Cloud Storage FUSE

En este documento, se proporcionan detalles sobre las opciones de almacenamiento en caché disponibles para Cloud Storage FUSE y cómo se puede configurar cada tipo de caché.

Para ayudar a aumentar el rendimiento de la recuperación de datos, Cloud Storage FUSE ofrece tres tipos de almacenamiento en caché opcional. Usa la siguiente tabla para obtener más información sobre cada tipo de almacenamiento en caché:

Tipo de almacenamiento en caché Descripción
Almacenamiento en caché de archivos

Acelera las lecturas de datos de archivos para cargas de trabajo con muchas lecturas que acceden a los datos de forma repetitiva, en especial, el entrenamiento de inteligencia artificial y aprendizaje automático, en el que los mismos archivos grandes se leen varias veces, lo que reduce significativamente la latencia.

Almacenamiento en caché de la lista

Acelera las operaciones de listado de directorios para cargas de trabajo que suelen enumerar todo el contenido de un directorio, como la iteración sobre un conjunto grande de archivos al comienzo de un trabajo de procesamiento, lo que mejora la velocidad del recorrido del directorio.

Almacenamiento en caché de estadísticas

Acelera las operaciones de metadatos de archivos para aplicaciones que suelen verificar los atributos de los archivos, lo que es común para muchas aplicaciones que verifican de forma repetida si un archivo cambió, lo que reduce la cantidad de llamadas a `GetMetadata` para Cloud Storage.

Consideraciones

  • Habilitar el almacenamiento en caché puede aumentar el rendimiento, pero reducir la coherencia, lo que suele ocurrir cuando accedes al mismo bucket con varios clientes con una tasa de cambio alta. Para reducir el impacto en la coherencia, recomendamos activar los buckets como de solo lectura. Para obtener más información sobre el comportamiento del almacenamiento en caché, consulta la documentación de semántica de Cloud Storage FUSE en GitHub.

  • Para evitar la hiperpaginación de caché, asegúrate de que todo tu conjunto de datos se ajuste a la capacidad de caché. Además, considera la capacidad y el rendimiento máximos que pueden proporcionar tus medios de caché. Si alcanzaste el rendimiento máximo de la caché aprovisionada, el límite de capacidad o ambos, es beneficioso leer directamente desde Cloud Storage, que tiene límites mucho más altos que Cloud Storage FUSE.

Ruta de lectura para los datos almacenados en caché

La caché de Cloud Storage FUSE acelera las lecturas repetidas después de que se transfieran a la caché. Las lecturas por primera vez y los errores de caché van directamente a Cloud Storage y están sujetos a latencias de red normales de Cloud Storage. Para mejorar el rendimiento de la primera lectura, consulta Cómo propagar previamente la caché de metadatos.

¿Qué sigue?