En este documento se proporciona información detallada sobre las opciones de almacenamiento en caché disponibles para Cloud Storage FUSE y sobre cómo se puede configurar cada tipo de caché.
Para mejorar el rendimiento de la recuperación de datos, Cloud Storage FUSE ofrece cuatro tipos de almacenamiento en caché opcional. Consulta la siguiente tabla para obtener más información sobre cada tipo de almacenamiento en caché:
Tipo de almacenamiento en caché | Descripción |
---|---|
Almacenamiento en caché de archivos | Acelera las lecturas de datos de archivos en cargas de trabajo con muchas lecturas que acceden a los datos de forma repetitiva, especialmente en el entrenamiento de inteligencia artificial y aprendizaje automático, donde se leen varias veces los mismos archivos grandes, lo que reduce significativamente la latencia. |
Almacenamiento en caché de listas | Acelera las operaciones de listado de directorios de las cargas de trabajo que listan con frecuencia todo el contenido de un directorio, como la iteración en un conjunto grande de archivos al principio de un trabajo de procesamiento, lo que mejora la velocidad de recorrido de los directorios. |
Almacenamiento en caché de estadísticas | Acelera las operaciones de metadatos de archivos para las aplicaciones que comprueban con frecuencia los atributos de los archivos, lo que es habitual en muchas aplicaciones que comprueban repetidamente si un archivo ha cambiado, lo que reduce el número de llamadas `GetMetadata` para Cloud Storage. |
Almacenamiento en caché de tipos | Acelera las comprobaciones de existencia de archivos o directorios en cargas de trabajo que realizan muchas comprobaciones de existencia o búsquedas de rutas, lo que mejora la latencia al reducir el número de solicitudes enviadas a Cloud Storage para comprobar si existe una ruta. |
Cuestiones importantes
Habilitar el almacenamiento en caché puede aumentar el rendimiento, pero reduce la coherencia, lo que suele ocurrir cuando se accede al mismo contenedor mediante varios clientes con una tasa de cambios alta. Para reducir el impacto en la coherencia, te recomendamos que montes los contenedores como de solo lectura. Para obtener más información sobre el comportamiento del almacenamiento en caché, consulta la sección Semántica de Cloud Storage FUSE en la documentación de GitHub de Cloud Storage FUSE.
Para evitar que la caché se agote, asegúrate de que todo tu conjunto de datos quepa en la capacidad de la caché. También debes tener en cuenta la capacidad máxima y el rendimiento que pueden ofrecer tus medios de caché. Si alcanzas el rendimiento máximo, el límite de capacidad o ambos de la caché aprovisionada, te recomendamos que leas directamente de Cloud Storage, que tiene límites mucho más altos que Cloud Storage FUSE.
Ruta de lectura de los datos almacenados en caché
La caché de Cloud Storage FUSE acelera las lecturas repetidas después de que se hayan insertado en la caché. Tanto las lecturas iniciales como los fallos de caché van directamente a Cloud Storage y están sujetas a las latencias de red normales de Cloud Storage. Para mejorar el rendimiento de la primera lectura, consulta Rellenar previamente la caché de metadatos.
Siguientes pasos
Más información sobre cada tipo de almacenamiento en caché: