Vista geral do armazenamento em cache no Cloud Storage FUSE

Este documento fornece detalhes sobre as opções de colocação em cache disponíveis para o Cloud Storage FUSE e como cada tipo de cache pode ser configurado.

Para ajudar a aumentar o desempenho da obtenção de dados, o Cloud Storage FUSE oferece quatro tipos de cache opcionais. Use a tabela seguinte para saber mais sobre cada tipo de colocação em cache:

Tipo de colocação em cache Descrição
Colocar ficheiros em cache

Acelera as leituras de dados de ficheiros para cargas de trabalho com muitas leituras que acedem repetidamente aos dados, especialmente a inteligência artificial e a preparação da aprendizagem automática, em que os mesmos ficheiros grandes são lidos várias vezes, reduzindo significativamente a latência.

Colocar listas em cache

Acelera as operações de listagem de diretórios para cargas de trabalho que listam frequentemente todo o conteúdo de um diretório, como a iteração sobre um grande conjunto de ficheiros no início de uma tarefa de processamento, melhorando a velocidade de deslocação nos diretórios.

Colocar em cache de estatísticas

Acelera as operações de metadados de ficheiros para aplicações que verificam frequentemente os atributos dos ficheiros, o que é comum para muitas aplicações que verificam repetidamente se um ficheiro foi alterado, reduzindo o número de chamadas `GetMetadata` para o Cloud Storage.

Colocar em cache de tipo

Acelera as verificações de existência de ficheiros ou diretórios para cargas de trabalho que realizam muitas verificações de existência ou pesquisas de caminhos, melhorando a latência ao reduzir o número de pedidos feitos ao Cloud Storage para verificar se existe um caminho.

Considerações

  • A ativação do armazenamento em cache pode aumentar o desempenho, mas reduzir a consistência, o que ocorre normalmente quando acede ao mesmo contentor através de vários clientes com uma taxa de alteração elevada. Para reduzir o impacto na consistência, recomendamos que monte contentores como só de leitura. Para saber mais sobre o comportamento da colocação em cache, consulte o artigo Semântica do FUSE do Cloud Storage na documentação do GitHub do FUSE do Cloud Storage.

  • Para evitar a instabilidade da cache, certifique-se de que todo o conjunto de dados se ajusta à capacidade da cache. Considere também a capacidade máxima e o desempenho que os seus meios de cache podem oferecer. Se atingir o desempenho máximo, o limite de capacidade ou ambos da cache aprovisionada, é vantajoso ler diretamente a partir do Cloud Storage, que tem limites muito superiores aos do Cloud Storage FUSE.

Caminho de leitura para dados em cache

A cache FUSE do Cloud Storage acelera as leituras repetidas depois de terem sido carregadas para a cache. As leituras iniciais e as falhas de cache vão diretamente para o Cloud Storage e estão sujeitas às latências de rede normais do Cloud Storage. Para melhorar o desempenho da primeira leitura, consulte o artigo Pré-preencha a cache de metadados.

O que se segue?