Elegir entre almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, eliges si sus clústeres almacenan datos en unidades de estado sólido (SSD) o en unidades de disco duro (HDD):
- El almacenamiento SSD es la opción más eficiente y rentable para la mayoría de los casos prácticos.
- El almacenamiento en HDD es adecuado en ocasiones para grandes conjuntos de datos que no son sensibles a la latencia o a los que no se accede con frecuencia.
Las instancias de Bigtable que usan almacenamiento SSD admiten el almacenamiento por niveles (vista previa). Puedes habilitar un nivel de almacenamiento de acceso infrecuente a nivel de tabla en clústeres SSD, donde puedes almacenar datos a los que no se accede con frecuencia de la forma más rentable. Para obtener más información, consulta el artículo Introducción al almacenamiento por niveles.
Independientemente del tipo de almacenamiento que elijas, tus datos se almacenan en un sistema de archivos distribuido y replicado que abarca muchas unidades físicas.
En la siguiente tabla se comparan los tipos de almacenamiento de Bigtable en el contexto del almacenamiento por niveles:
Instancia y nivel | Capacidad de los nodos | Latencia prevista | Operaciones | Usos recomendados |
---|---|---|---|---|
Instancia SSD, nivel de almacenamiento SSD | 5 TB | Escritura o lectura: milisegundos de un solo dígito | Escribir, leer, actualizar y eliminar | Cargas de trabajo de alto rendimiento de lectura y escritura, y baja latencia |
Instancia SSD con almacenamiento por niveles habilitado | 32 TB (hasta 5 TB SSD) | Escritura: ms de un solo dígito Lectura: decenas de milisegundos |
Escribir, leer, actualizar y eliminar | Conjuntos de datos de gran tamaño con datos a los que no se accede con frecuencia |
Instancia de HDD, nivel de HDD | 16 TB | Escritura: ms de un solo dígito Lectura: decenas de milisegundos |
Escribir, leer, actualizar y eliminar | Conjuntos de datos grandes con cargas de trabajo que no requieren baja latencia |
Para obtener más información sobre el rendimiento de los tipos de almacenamiento de Bigtable, consulta Información sobre el rendimiento.
Si tienes dudas, elige el almacenamiento SSD
Hay varios motivos por los que suele ser mejor usar el almacenamiento SSD en tu clúster de Bigtable:
- Las unidades SSD son mucho más rápidas y tienen un rendimiento más predecible que las HDD. En un clúster de Bigtable, el almacenamiento SSD ofrece latencias significativamente más bajas para las lecturas y las escrituras que el almacenamiento HDD.
- El rendimiento de los HDD es mucho más limitado que el de los SSD. En un clúster que usa almacenamiento HDD, es posible alcanzar el rendimiento máximo antes de que el uso de la CPU llegue al 100 %. Puedes monitorizar esta situación con la métrica Carga de disco. Para aumentar el rendimiento, debes añadir más nodos, pero el coste de los nodos adicionales puede superar el ahorro que obtienes al usar el almacenamiento en HDD. El almacenamiento SSD no tiene esta limitación, ya que ofrece un rendimiento mucho mayor por nodo. Por lo general, un clúster que usa almacenamiento SSD alcanza el rendimiento máximo solo cuando utiliza toda la CPU y la memoria disponibles.
- Las lecturas de filas individuales en un disco duro son muy lentas. Debido al tiempo de búsqueda del disco, el almacenamiento en HDD solo admite el 5% de las filas leídas por segundo del almacenamiento en SSD. Sin embargo, las lecturas de varias filas grandes no se ven tan afectadas.
- El almacenamiento SSD admite una opción de almacenamiento por niveles para datos a los que no se accede con frecuencia.
Una posible desventaja del almacenamiento SSD es que requiere más nodos en tus clústeres en función de la cantidad de datos que almacenes. Sin embargo, en la práctica, es posible que necesites esos nodos adicionales para que tus clústeres puedan gestionar el tráfico entrante, no solo para admitir la cantidad de datos que almacenas.
Casos prácticos de almacenamiento en HDD
El almacenamiento en HDD es adecuado para los casos prácticos que cumplen todos los criterios siguientes:
- Tus cargas de trabajo se basan en datos y en escritura.
- Tus cargas de trabajo no son sensibles a la latencia.
- Tus datos no admiten una aplicación orientada a los usuarios.
- Tus cargas de trabajo por lotes se componen principalmente de análisis y escrituras con lecturas aleatorias ocasionales de un pequeño número de filas o lecturas de puntos.
- No tienes previsto usar Data Boost, el almacenamiento por niveles o el escalado de nodos al doble.
Por ejemplo, si tienes previsto almacenar un gran volumen de datos históricos de un gran número de dispositivos de teledetección y, a continuación, usar esos datos para generar informes diarios, el ahorro de costes del almacenamiento en HDD podría justificar la pérdida de rendimiento. Por otro lado, si tienes previsto usar los datos para mostrar un panel de control en tiempo real, no sería recomendable usar el almacenamiento en HDD, ya que las lecturas serían mucho más frecuentes en este caso y las lecturas que no son análisis son mucho más lentas con el almacenamiento en HDD.
Cambiar entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, la elección del almacenamiento SSD o HDD para la instancia es permanente. No puedes usar la consolaGoogle Cloud para cambiar el tipo de almacenamiento que se usa en la instancia.
Si quieres cambiar el tipo de almacenamiento en el que se guarda una tabla, usa la función de copias de seguridad:
- Crea o planifica el uso de una instancia que utilice el tipo de almacenamiento que quieras.
- Crea una copia de seguridad de la tabla.
- Restaura la copia de seguridad en una tabla nueva de la otra instancia.
Siguientes pasos
- Crea una instancia con almacenamiento SSD o HDD.
- Consulta información sobre el almacenamiento por niveles.