Elige entre el almacenamiento SSD y HDD

Cuando creas una instancia de Bigtable, debes elegir si sus clústeres almacenarán los datos en unidades de estado sólido (SSD) o en discos duros (HDD):

  • El almacenamiento SSD es la elección más eficiente y rentable para la mayoría de los casos prácticos.
  • El almacenamiento HDD a veces es adecuado para conjuntos de datos grandes que no sean sensibles a la latencia o a los que se accede muy poco.

Las instancias de Bigtable que usan almacenamiento SSD admiten el almacenamiento en niveles (vista previa). Puedes habilitar un nivel de almacenamiento de acceso poco frecuente a nivel de la tabla en clústeres SSD donde puedes almacenar datos de acceso poco frecuente de la manera más rentable. Para obtener más información, consulta Descripción general del almacenamiento en niveles.

Sin importar el tipo de almacenamiento que elijas, tus datos se almacenarán en un sistema de archivos replicado y distribuido que abarca miles de millones de unidades físicas.

Comparación de niveles de almacenamiento

En las siguientes tablas, se comparan los niveles de almacenamiento de Bigtable, según la edición de tu instancia.

Edición Enterprise

Nivel de almacenamiento Capacidad del nodo Latencia esperada Operaciones Ideal para
Instancia de SSD 5 TB de SSD Escritura/lectura: ms de un solo dígito Escribe, lee, actualiza y borra Cargas de trabajo de alta capacidad de procesamiento de escritura/lectura y baja latencia
Instancia de SSD, almacenamiento en niveles habilitado 32 TB (hasta 5 TB de SSD) Escritura/lectura de SSD: ms de un solo dígito Escribe, lee, actualiza y borra Conjuntos de datos grandes con datos de acceso poco frecuente
Acceso poco frecuente: ms de dos dígitos bajos Solo lectura
Instancia de HDD 16 TB Escritura: ms de un solo dígito
Lectura: ms de dos dígitos bajos
Escribe, lee, actualiza y borra Conjuntos de datos grandes con cargas de trabajo insensibles a la latencia

Edición Enterprise Plus

Nivel de almacenamiento Capacidad del nodo Latencia esperada Operaciones Ideal para
Instancia de SSD 5 TB de SSD Escritura/lectura: ms de un solo dígito Escribe, lee, actualiza y borra Cargas de trabajo de alta capacidad de procesamiento de escritura/lectura y baja latencia
Instancia de SSD, almacenamiento en niveles habilitado 64 TB (hasta 5 TB de SSD) Escritura/lectura de SSD: ms de un solo dígito Escribe, lee, actualiza y borra Conjuntos de datos grandes con datos de acceso poco frecuente
Acceso poco frecuente: ms de dos dígitos bajos Solo lectura
Instancia de HDD 16 TB Escritura: ms de un solo dígito
Lectura: ms de dos dígitos bajos
Escribe, lee, actualiza y borra Conjuntos de datos grandes con cargas de trabajo insensibles a la latencia

Para obtener más información sobre el rendimiento de los tipos de almacenamiento de Bigtable, consulta Comprende el rendimiento. Para obtener más información sobre las ediciones, consulta Descripción general de las ediciones.

Si tienes dudas, elige el almacenamiento SSD

Existen muchos motivos por los que, generalmente, es mejor usar el almacenamiento SSD en tu clúster de Bigtable:

  • El SSD es mucho más rápido y tiene un rendimiento más predecible que el HDD. En un clúster de Bigtable, el almacenamiento SSD ofrece latencias mucho más bajas para las operaciones de lectura y escritura que el almacenamiento HDD.
  • La capacidad de procesamiento del HDD es mucho más limitada que la del SSD. En un clúster que usa almacenamiento HDD, es posible alcanzar la capacidad de procesamiento máxima antes de que el uso de CPU alcance el 100%, una situación que se puede supervisar mediante la métrica carga del disco. Para aumentar la capacidad de procesamiento, debes agregar más nodos, pero el costo de los nodos adicionales podría exceder tus ahorros que obtienes por usar el almacenamiento HDD. El almacenamiento SSD no tiene esta limitación, ya que su capacidad de procesamiento por nodo es mucho mayor; por lo general, un clúster que usa almacenamiento SSD solo alcanza el máximo de la capacidad de procesamiento cuando usa toda la CPU y memoria disponibles.
  • Las lecturas de filas individuales en HDD son muy lentas. Debido al tiempo de búsqueda en el disco, el almacenamiento HDD solo admite el 5% de las lecturas de filas por segundo que se realizan en el almacenamiento SSD. Sin embargo, los análisis grandes de varias filas no se ven afectados negativamente.
  • El almacenamiento SSD admite una opción de almacenamiento en niveles para datos de acceso poco frecuente.
  • El nivel en la memoria (vista previa) solo está disponible para las instancias que usan almacenamiento SSD. En la memoria, se requiere la edición Enterprise Plus.

Una posible desventaja del almacenamiento SSD es que requiere más nodos en tus clústeres según la cantidad de datos que almacenes. Sin embargo, en la práctica, es posible que necesites esos nodos adicionales a fin de que tus clústeres puedan controlar todo el tráfico entrante, no solo para admitir la cantidad de datos que almacenas.

Casos prácticos del almacenamiento HDD

El almacenamiento HDD es útil en los casos prácticos que cumplen con todos los siguientes criterios:

  • Tus cargas de trabajo tienen muchas operaciones de escritura y se basan en datos.
  • Tus cargas de trabajo son insensibles a la latencia.
  • Tus datos no admiten una aplicación orientada al usuario.
  • Tus cargas de trabajo por lotes consisten principalmente en análisis y escrituras con lecturas aleatorias ocasionales de una pequeña cantidad de filas o lecturas de puntos.
  • No planeas usar el ajuste de escala de nodos 2x.
  • En la edición Enterprise Plus, planeas usar Data Boost para HDD.

Por ejemplo, si piensas almacenar una gran cantidad de datos históricos de muchos dispositivos de teledetección y, luego, usarlos para generar informes diarios, los ahorros por usar almacenamiento HDD compensarían el sacrificio de rendimiento. Por el contrario, si piensas usar los datos para mostrar un panel en tiempo real, probablemente no sea recomendable usar el almacenamiento HDD; en este caso, las lecturas serían mucho más frecuentes, y estas que no son análisis son mucho más lentas con el almacenamiento HDD.

Cambia entre el almacenamiento SSD y HDD

Cuando creas una instancia de Bigtable, la elección de almacenamiento SSD o HDD que elijas para ella es permanente. No puedes usar la Google Cloud consola para cambiar el tipo de almacenamiento que se usa para la instancia.

Si deseas cambiar el tipo de almacenamiento en el que se almacena una tabla, usa la función de copias de seguridad:

  1. Crea o planifica usar una instancia que use el tipo de almacenamiento que deseas.
  2. Crea una copia de seguridad de la tabla.
  3. Restablece desde la copia de seguridad a una tabla nueva en la otra instancia

¿Qué sigue?