Este documento fornece detalhes sobre as opções de colocação em cache disponíveis para o Cloud Storage FUSE e como cada tipo de cache pode ser configurado.
Para ajudar a aumentar o desempenho da obtenção de dados, o Cloud Storage FUSE oferece quatro tipos de cache opcionais. Use a tabela seguinte para saber mais sobre cada tipo de colocação em cache:
Tipo de colocação em cache | Descrição |
---|---|
Colocar ficheiros em cache | Acelera as leituras de dados de ficheiros para cargas de trabalho com muitas leituras que acedem repetidamente aos dados, especialmente a inteligência artificial e a preparação da aprendizagem automática, em que os mesmos ficheiros grandes são lidos várias vezes, reduzindo significativamente a latência. |
Colocar listas em cache | Acelera as operações de listagem de diretórios para cargas de trabalho que listam frequentemente todo o conteúdo de um diretório, como a iteração sobre um grande conjunto de ficheiros no início de uma tarefa de processamento, melhorando a velocidade de deslocação nos diretórios. |
Colocar em cache de estatísticas | Acelera as operações de metadados de ficheiros para aplicações que verificam frequentemente os atributos dos ficheiros, o que é comum para muitas aplicações que verificam repetidamente se um ficheiro foi alterado, reduzindo o número de chamadas `GetMetadata` para o Cloud Storage. |
Colocar em cache de tipo | Acelera as verificações de existência de ficheiros ou diretórios para cargas de trabalho que realizam muitas verificações de existência ou pesquisas de caminhos, melhorando a latência ao reduzir o número de pedidos feitos ao Cloud Storage para verificar se existe um caminho. |
Considerações
A ativação do armazenamento em cache pode aumentar o desempenho, mas reduzir a consistência, o que ocorre normalmente quando acede ao mesmo contentor através de vários clientes com uma taxa de alteração elevada. Para reduzir o impacto na consistência, recomendamos que monte contentores como só de leitura. Para saber mais sobre o comportamento da colocação em cache, consulte o artigo Semântica do FUSE do Cloud Storage na documentação do GitHub do FUSE do Cloud Storage.
Para evitar a instabilidade da cache, certifique-se de que todo o conjunto de dados se ajusta à capacidade da cache. Considere também a capacidade máxima e o desempenho que os seus meios de cache podem oferecer. Se atingir o desempenho máximo, o limite de capacidade ou ambos da cache aprovisionada, é vantajoso ler diretamente a partir do Cloud Storage, que tem limites muito superiores aos do Cloud Storage FUSE.
Caminho de leitura para dados em cache
A cache FUSE do Cloud Storage acelera as leituras repetidas depois de terem sido carregadas para a cache. As leituras iniciais e as falhas de cache vão diretamente para o Cloud Storage e estão sujeitas às latências de rede normais do Cloud Storage. Para melhorar o desempenho da primeira leitura, consulte o artigo Pré-preencha a cache de metadados.
O que se segue?
Saiba mais sobre cada tipo de colocação em cache: