Elige entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, debes elegir si sus clústeres almacenarán los datos en unidades de estado sólido (SSD) o en discos duros (HDD):
- El almacenamiento SSD es la elección más eficiente y rentable para la mayoría de los casos prácticos.
- El almacenamiento HDD a veces es adecuado para conjuntos de datos grandes que no sean sensibles a la latencia o a los que se accede muy poco.
Las instancias de Bigtable que usan almacenamiento SSD admiten el almacenamiento por niveles (vista previa). Puedes habilitar un nivel de almacenamiento de acceso poco frecuente a nivel de la tabla en clústeres SSD, en el que puedes almacenar datos a los que se accede con poca frecuencia de la manera más rentable. Para obtener más información, consulta la Descripción general del almacenamiento por niveles.
Sin importar el tipo de almacenamiento que elijas, tus datos se almacenarán en un sistema de archivos replicado y distribuido que abarca miles de millones de unidades físicas.
En la siguiente tabla, se comparan los tipos de almacenamiento de Bigtable en el contexto del almacenamiento por niveles:
Instancia y nivel | Capacidad del nodo | Latencia esperada | Operaciones | Ideal para |
---|---|---|---|---|
Instancia SSD, nivel de almacenamiento SSD | 5 TB | Lectura/escritura: milisegundos de un solo dígito | Escribir, leer, actualizar y borrar | Cargas de trabajo de alta capacidad de procesamiento de lectura y escritura, y baja latencia |
Instancia SSD con almacenamiento en niveles habilitado | 32 TB (hasta 5 TB SSD) | Escritura: milisegundos de un solo dígito Lectura: Milisegundos bajos de dos dígitos |
Escribir, leer, actualizar y borrar | Conjuntos de datos grandes con datos de acceso infrecuente |
Instancia de HDD, nivel de HDD | 16 TB | Escritura: milisegundos de un solo dígito Lectura: Milisegundos bajos de dos dígitos |
Escribir, leer, actualizar y borrar | Conjuntos de datos grandes con cargas de trabajo que no son sensibles a la latencia |
Para obtener más información sobre el rendimiento de los tipos de almacenamiento de Bigtable, consulta Información sobre el rendimiento.
Si tienes dudas, elige el almacenamiento SSD
Existen muchos motivos por los que, generalmente, es mejor usar el almacenamiento SSD en tu clúster de Bigtable:
- El SSD es mucho más rápido y tiene un rendimiento más predecible que el HDD. En un clúster de Bigtable, el almacenamiento SSD ofrece latencias mucho más bajas para las operaciones de lectura y escritura que el almacenamiento HDD.
- La capacidad de procesamiento del HDD es mucho más limitada que la del SSD. En un clúster que usa almacenamiento HDD, es posible alcanzar la capacidad de procesamiento máxima antes de que el uso de CPU alcance el 100%, una situación que se puede supervisar mediante la métrica carga del disco. Para aumentar la capacidad de procesamiento, debes agregar más nodos, pero el costo de los nodos adicionales podría exceder tus ahorros que obtienes por usar el almacenamiento HDD. El almacenamiento SSD no tiene esta limitación, ya que su capacidad de procesamiento por nodo es mucho mayor; por lo general, un clúster que usa almacenamiento SSD solo alcanza el máximo de la capacidad de procesamiento cuando usa toda la CPU y memoria disponibles.
- Las lecturas de filas individuales en HDD son muy lentas. Debido al tiempo de búsqueda en el disco, el almacenamiento HDD solo admite el 5% de las lecturas de filas por segundo que se realizan en el almacenamiento SSD. Sin embargo, los análisis grandes de varias filas no se ven afectados negativamente.
- El almacenamiento SSD admite una opción de almacenamiento por niveles para los datos a los que se accede con poca frecuencia.
Una posible desventaja del almacenamiento SSD es que requiere más nodos en tus clústeres según la cantidad de datos que almacenes. Sin embargo, en la práctica, es posible que necesites esos nodos adicionales a fin de que tus clústeres puedan controlar todo el tráfico entrante, no solo para admitir la cantidad de datos que almacenas.
Casos prácticos del almacenamiento HDD
El almacenamiento HDD es adecuado para los casos de uso que cumplen con todos los siguientes criterios:
- Tus cargas de trabajo tienen un uso intensivo de escritura y se basan en datos.
- Tus cargas de trabajo no son sensibles a la latencia.
- Tus datos no admiten una aplicación orientada al usuario.
- Tus cargas de trabajo por lotes consisten principalmente en análisis y escrituras con lecturas aleatorias ocasionales de una pequeña cantidad de filas o lecturas de puntos.
- No planeas usar Data Boost, almacenamiento por niveles ni escalamiento de nodos 2x.
Por ejemplo, si piensas almacenar una gran cantidad de datos históricos de muchos dispositivos de teledetección y, luego, usarlos para generar informes diarios, los ahorros por usar almacenamiento HDD compensarían el sacrificio de rendimiento. Por el contrario, si piensas usar los datos para mostrar un panel en tiempo real, probablemente no sea recomendable usar el almacenamiento HDD; en este caso, las lecturas serían mucho más frecuentes, y estas que no son análisis son mucho más lentas con el almacenamiento HDD.
Cambia entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, la elección de almacenamiento SSD o HDD que elijas para ella es permanente. No puedes usar la consola deGoogle Cloud para cambiar el tipo de almacenamiento que se usa para la instancia.
Si deseas cambiar el tipo de almacenamiento en el que se almacena una tabla, usa la función de copias de seguridad:
- Crea o planifica usar una instancia que use el tipo de almacenamiento que deseas.
- Crea una copia de seguridad de la tabla.
- Restablece desde la copia de seguridad a una tabla nueva en la otra instancia
¿Qué sigue?
- Crea una instancia con almacenamiento SSD o HDD.
- Obtén más información sobre el almacenamiento por niveles.