Escolher entre armazenamento SSD e HDD
Ao criar uma instância do Bigtable, você escolhe se os clusters dela armazenam dados em unidades de estado sólido (SSD, na sigla em inglês) ou unidades de disco rígido (HDD, na sigla em inglês):
- O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos casos de uso.
- Às vezes, o armazenamento HDD é apropriado para grandes conjuntos de dados que não são sensíveis à latência ou são acessados com pouca frequência.
As instâncias do Bigtable que usam armazenamento SSD são compatíveis com o armazenamento em camadas (pré-lançamento). É possível ativar um nível de armazenamento de acesso infrequente no nível da tabela em clusters SSD, onde você pode armazenar dados acessados com pouca frequência da maneira mais econômica. Para mais informações, consulte Visão geral do armazenamento em níveis.
Independentemente do tipo de armazenamento que você escolher, os dados serão armazenados em um sistema de arquivos distribuído e replicado que se estende por muitas unidades físicas.
A tabela a seguir compara os tipos de armazenamento do Bigtable no contexto do armazenamento em camadas:
Instância e nível | Capacidade do nó | Latência esperada | Operações | Ideal para |
---|---|---|---|---|
Instância SSD, nível de armazenamento SSD | 5 TB | Gravação/leitura: ms de um dígito | Gravar, ler, atualizar, excluir | Cargas de trabalho de alta capacidade de gravação/leitura e baixa latência |
Instância de SSD com armazenamento em níveis ativado | 32 TB (até 5 TB SSD) | Gravação: ms de um dígito Leitura: ms de dois dígitos baixos |
Gravar, ler, atualizar, excluir | Grandes conjuntos de dados com informações acessadas com pouca frequência |
Instância de HDD, nível de HDD | 16 TB | Gravação: ms de um dígito Leitura: ms de dois dígitos baixos |
Gravar, ler, atualizar, excluir | Grandes conjuntos de dados com cargas de trabalho insensíveis à latência |
Para mais informações sobre o desempenho dos tipos de armazenamento do Bigtable, consulte Entender o desempenho.
Na dúvida, escolha o armazenamento SSD
Há vários motivos pelo qual é melhor usar o armazenamento SSD para seu cluster do Bigtable:
- O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Em um cluster do Bigtable, o armazenamento SSD oferece latências significativamente menores para leituras e gravações do que o armazenamento HDD.
- A capacidade do HDD é muito mais limitada que a do SSD. Em um cluster que usa o armazenamento HDD, é possível atingir a capacidade máxima antes que o uso da CPU atinja 100%. É possível monitorar esta situação usando a métrica de carregamento de disco. Para aumentar a capacidade, é preciso adicionar mais nós, mas o custo de nós adicionais pode facilmente estourar seu orçamento ao usar o armazenamento HDD. O armazenamento SSD não tem essa limitação, porque oferece muito mais capacidade por nó. Geralmente, um cluster que usa armazenamento SSD atinge o máximo da capacidade somente quando está usando toda a CPU e memória disponíveis.
- As leituras de linhas individuais no HDD são muito lentas. Devido ao tempo de busca do disco, o armazenamento do HDD é compatível apenas com 5% das linhas lidas por segundo de armazenamento SSD. No entanto, grandes verificações em várias linhas não são tão prejudicadas.
- O armazenamento SSD oferece uma opção de armazenamento em camadas para dados acessados com pouca frequência.
Uma possível desvantagem do armazenamento SSD é que ele exige mais nodes nos clusters com base nos dados armazenados. Porém, na prática, talvez você precise de nodes extras. Dessa maneira, os clusters podem acompanhar o tráfego de entrada e não servirão apenas para dar suporte ao volume de dados que está armazenando.
Casos de uso de armazenamento HDD
O armazenamento HDD é adequado para casos de uso que atendem a todos estes critérios:
- Suas cargas de trabalho são pesadas em gravação e orientadas por dados.
- Suas cargas de trabalho não são sensíveis à latência.
- Seus dados não oferecem suporte a um aplicativo voltado ao usuário.
- Suas cargas de trabalho em lote consistem principalmente em verificações e gravações com leituras aleatórias ocasionais de um pequeno número de linhas ou leituras pontuais.
- Você não planeja usar o Data Boost, o armazenamento em camadas ou o escalonamento de nós 2x.
Por exemplo, caso você pretenda armazenar dados históricos extensos para um grande número de dispositivos de detecção remota e use os dados para gerar relatórios diários, a economia no armazenamento HDD pode justificar a implicação no desempenho. Por outro lado, se você planeja usar os dados para exibir um painel em tempo real, provavelmente não faria sentido usar o armazenamento HDD, porque as leituras seriam muito mais frequentes neste caso, e as leituras que não são verificações são muito mais lentas com armazenamento HDD.
Troca entre armazenamento SSD e HDD
Quando você cria uma instância do Bigtable, a escolha de armazenamento SSD ou HDD para a instância é permanente. Não é possível usar o consoleGoogle Cloud para mudar o tipo de armazenamento usado para a instância.
Para alterar o tipo de armazenamento da tabela, use o recurso de backups:
- Crie ou planeje usar uma instância que use o tipo de armazenamento desejado.
- Crie um backup da tabela.
- Faça a restauração do backup para uma nova tabela na outra instância.
A seguir
- Crie uma instância com armazenamento SSD ou HDD.
- Saiba mais sobre o armazenamento por níveis.