Escolha entre o armazenamento SSD e HDD

Quando cria uma instância do Bigtable, escolhe se os respetivos clusters armazenam dados em unidades de estado sólido (SSD) ou unidades de discos rígidos (HDD):

  • O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos exemplos de utilização.
  • O armazenamento em HDD é, por vezes, adequado para grandes conjuntos de dados que não são sensíveis à latência ou aos quais se acede com pouca frequência.

As instâncias do Bigtable que usam armazenamento SSD suportam o armazenamento hierárquico (pré-visualização). Pode ativar um nível de armazenamento de acesso pouco frequente ao nível da tabela em clusters de SSDs, onde pode armazenar dados acedidos com pouca frequência da forma mais rentável. Para mais informações, consulte o artigo Vista geral do armazenamento em camadas.

Independentemente do tipo de armazenamento que escolher, os seus dados são armazenados num sistema de ficheiros distribuído e replicado que abrange muitas unidades físicas.

A tabela seguinte compara os tipos de armazenamento do Bigtable no contexto do armazenamento hierárquico:

Instância e nível Capacidade do nó Latência esperada Operações Ideal para
Instância de SSD, nível de armazenamento de SSD 5 TB Escrita/leitura: ms de um único dígito Escrever, ler, atualizar e eliminar Rendimento de leitura/escrita elevado e cargas de trabalho de latência baixa
Instância de SSD, armazenamento hierárquico ativado 32 TB (até 5 TB SSD)

Escrita: ms de um único dígito

Leitura: ms de dois dígitos baixos

Escrever, ler, atualizar e eliminar Grandes conjuntos de dados com dados acedidos com pouca frequência
Instância de HDD, nível de HDD 16 TB

Escrita: ms de um único dígito

Leitura: ms de dois dígitos baixos

Escrever, ler, atualizar e eliminar Grandes conjuntos de dados com cargas de trabalho insensíveis à latência

Para mais informações sobre o desempenho dos tipos de armazenamento do Bigtable, consulte o artigo Compreender o desempenho.

Em caso de dúvida, escolha o armazenamento SSD

Existem vários motivos pelos quais é geralmente melhor usar o armazenamento SSD para o seu cluster do Bigtable:

  • O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Num cluster do Bigtable, o armazenamento SSD oferece latências significativamente mais baixas para leituras e escritas do que o armazenamento HDD.
  • O débito do HDD é muito mais limitado do que o débito do SSD. Num cluster que usa armazenamento de HDD, é possível atingir o débito máximo antes de a utilização da CPU atingir 100%, uma situação que pode monitorizar através da métrica carga do disco. Para aumentar a taxa de transferência, tem de adicionar mais nós, mas o custo dos nós adicionais pode exceder as poupanças da utilização do armazenamento de HDD. O armazenamento SSD não tem esta limitação, porque oferece muito mais débito por nó. Geralmente, um cluster que usa armazenamento SSD atinge o débito máximo apenas quando está a usar toda a CPU e memória disponíveis.
  • As leituras de linhas individuais no HDD são muito lentas. Devido ao tempo de procura no disco, o armazenamento em HDD suporta apenas 5% das linhas lidas por segundo do armazenamento em SSD. No entanto, as análises de várias linhas grandes não são tão afetadas negativamente.
  • O armazenamento SSD suporta uma opção de armazenamento em camadas para dados acedidos com pouca frequência.

Uma potencial desvantagem do armazenamento SSD é que requer mais nós nos seus clusters com base na quantidade de dados que armazena. No entanto, na prática, pode precisar desses nós adicionais para que os seus clusters possam acompanhar o tráfego recebido, não só para suportar a quantidade de dados que está a armazenar.

Exemplos de utilização do armazenamento HDD

O armazenamento em HDD é adequado para exemplos de utilização que cumprem todos os seguintes critérios:

  • As suas cargas de trabalho são de escrita intensiva e orientadas por dados.
  • As suas cargas de trabalho não são sensíveis à latência.
  • Os seus dados não suportam uma aplicação virada para o utilizador.
  • As suas cargas de trabalho em lote consistem principalmente em análises e gravações com leituras aleatórias ocasionais de um pequeno número de linhas ou leituras de pontos.
  • Não planeia usar o Data Boost, armazenamento em camadas ou o escalamento de nós 2x.

Por exemplo, se planear armazenar dados do histórico extensos para um grande número de dispositivos de deteção remota e, em seguida, usar os dados para gerar relatórios diários, a poupança de custos do armazenamento em HDD pode justificar a compensação de desempenho. Por outro lado, se planeia usar os dados para apresentar um painel de controlo em tempo real, não faz sentido usar o armazenamento HDD. As leituras seriam muito mais frequentes neste caso, e as leituras que não são verificações são muito mais lentas com o armazenamento HDD.

Alternar entre o armazenamento SSD e HDD

Quando cria uma instância do Bigtable, a sua escolha de armazenamento SSD ou HDD para a instância é permanente. Não pode usar a consolaGoogle Cloud para alterar o tipo de armazenamento usado para a instância.

Se quiser alterar o tipo de armazenamento em que uma tabela está armazenada, use a funcionalidade de cópias de segurança:

  1. Crie ou planeie usar uma instância que use o tipo de armazenamento pretendido.
  2. Crie uma cópia de segurança da tabela.
  3. Restaure a partir da cópia de segurança para uma nova tabela na outra instância.

O que se segue?