Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Escalador automático administrado

En esta página, se describe cómo funciona el escalador automático administrado y se explican los costos y las limitaciones cuando se usa el escalador automático administrado de Spanner. También proporciona información para ayudarte a determinar cómo configurar el escalador automático administrado.

Cómo funciona el escalador automático administrado

Cuando habilitas el escalador automático administrado, Spanner ajusta automáticamente el tamaño de tu instancia. Puedes habilitar el escalador automático administrado en tu instancia o partición de instancia de Spanner (en versión preliminar). La función de escalador automático administrado reacciona a los cambios en la carga de trabajo o las necesidades de almacenamiento de tu instancia a medida que aumenta o disminuye la carga. El escalador automático administrado aumenta la escala, agregando capacidad de procesamiento a la instancia, o reduce la escala, quitando capacidad de procesamiento de la instancia.

Cuando configuras el escalador automático administrado, puedes usar unidades de procesamiento para instancias pequeñas o nodos para instancias grandes. En este documento, usamos el término capacidad de procesamiento para referirnos a los nodos o las unidades de procesamiento.

El escalador automático administrado de Spanner determina cuánta capacidad de procesamiento se requiere en función de lo siguiente:

Objetivo de uso de CPU de alta prioridad
Objetivo de uso total de CPU
Objetivo de uso de almacenamiento
Límite mínimo
Límite máximo

Cada dimensión de escalamiento genera un tamaño de instancia recomendado, y Spanner usa automáticamente el más alto. Esto significa que, por ejemplo, si tu instancia necesita 10 nodos para cumplir con tu objetivo de uso de almacenamiento, pero 12 nodos para cumplir con tu objetivo de uso de CPU, Spanner escala la instancia a 12 nodos.

A medida que cambia la cantidad de capacidad de procesamiento, Spanner optimiza el almacenamiento de forma continua. Rebalancea los datos en todos los servidores para garantizar que el tráfico se distribuya de manera uniforme y que ningún servidor individual se sobrecargue. Para obtener más información, consulta Limitaciones.

Si el escalador automático administrado escala una instancia hasta su límite máximo, pero la carga de trabajo sigue provocando un uso de CPU más alto que el objetivo, es posible que las solicitudes de carga de trabajo tengan una latencia más alta o fallen. Si una instancia escala verticalmente hasta su objetivo de capacidad de procesamiento máxima, pero la carga de trabajo necesita más almacenamiento que el límite máximo, es posible que las solicitudes de escritura fallen. Para saber si se alcanzó el objetivo máximo, puedes ver los registros de eventos del sistema del escalador automático administrado en la consola de Google Cloud en la página Estadísticas del sistema. Para obtener más información, consulta los límites de almacenamiento.

Cuando Spanner reduce la escala de una instancia, quita capacidad de procesamiento a una velocidad menor que cuando la aumenta, para reducir cualquier impacto en la latencia.

Puedes elegir escalar automáticamente de forma asimétrica las réplicas de solo lectura en tus instancias. No puedes ajustar la escala automáticamente de forma asimétrica en las particiones de instancias. Para obtener más información, consulta Ajuste de escala automático asimétrico de solo lectura.

Precios

Tus costos totales de Spanner pueden ser más bajos o más altos según cómo hayas configurado tu instancia o partición de instancia de Spanner antes de habilitar el escalador automático administrado y los límites que establezcas para el escalador automático administrado.

Por ejemplo, si antes configurabas manualmente tu instancia de Spanner para que tuviera suficiente capacidad de procesamiento para controlar las cargas de trabajo máximas en cualquier momento, tus costos con el escalador automático administrado podrían ser más bajos porque reduce la capacidad de procesamiento cuando la instancia está inactiva.

Por ejemplo, si antes configurabas manualmente tu instancia de Spanner para que tuviera suficiente capacidad de procesamiento para las cargas de trabajo promedio y el rendimiento general se degrada cuando aumenta el tráfico de tu carga de trabajo, tus costos con el escalador automático administrado podrían ser más altos porque el escalador automático administrado podría aumentar la capacidad de procesamiento cuando la instancia esté ocupada. Sin embargo, esto proporciona a tus usuarios un rendimiento más coherente.

Puedes limitar el costo máximo de tu instancia de Spanner estableciendo el límite máximo de nodos o unidades de procesamiento en el nivel que desees gastar.

Es posible que observes un aumento en la capacidad de procesamiento utilizada y, por lo tanto, un aumento en los costos cuando estableces un objetivo de uso de CPU total en tu instancia de Spanner en comparación con solo establecer un objetivo de uso de CPU de prioridad alta. Sin embargo, el usuario final tiene una experiencia significativamente mejor y un rendimiento mejorado cuando se establece esta opción.

Limitaciones

Se aplican las siguientes limitaciones cuando habilitas o cambias la función de ajuste de escala automático administrado en una instancia o partición de instancia:

No puedes mover una instancia cuando la función de ajuste de escala automático administrado está habilitada. Primero debes inhabilitar el escalador automático administrado y, luego, mover la instancia. Después de mover la instancia, puedes volver a habilitar el escalador automático administrado.
Debes establecer el límite mínimo en la instancia de ajuste de escala automático en 1,000 unidades de procesamiento o más, o en 1 nodo o más.
Cuando habilitas el ajuste de escala automático en una instancia existente, la capacidad de la instancia existente puede ser inferior al valor límite mínimo que configuras en el escalador automático administrado. Sin embargo, la instancia se ajusta automáticamente al valor mínimo configurado cuando la inicias. Por ejemplo, si tu instancia tiene un nodo, pero estableces el valor mínimo en dos nodos, cuando inicies la instancia, se ajustará automáticamente a dos nodos.
No puedes ajustar la escala automáticamente de forma asimétrica en las particiones de instancias.
Si la cantidad de filas de posición en tu partición es superior a 100 millones, no habilites el ajuste de escala automático. Esta es una limitación del particionado geográfico.

Parámetros del escalador automático administrado

Cuando creas o editas una instancia o una partición de instancia y eliges habilitar el ajustador de escala automático administrado, defines los valores que se muestran en la siguiente tabla.

Parámetro	Descripción
Objetivo de uso de CPU de alta prioridad	Es un porcentaje de la capacidad de CPU de la instancia que se usará para tareas de prioridad alta. Este valor debe ser de entre el 10% y el 90%. Cuando el uso de CPU de alta prioridad de una instancia supera el objetivo que estableciste, Spanner agrega capacidad de procesamiento a la instancia de inmediato. Cuando el uso de CPU es mucho más bajo que el objetivo, Spanner quita capacidad de procesamiento. Para obtener más información, consulta Cómo determinar el objetivo de uso de CPU de alta prioridad.
Objetivo de uso total de CPU	Es un porcentaje de la capacidad total de CPU de la instancia que se usará para tareas de prioridad alta, media y baja. Este valor debe ser de entre el 10% y el 90%. Cuando el uso de CPU total de una instancia supera el objetivo que estableciste, Spanner agrega capacidad de procesamiento a la instancia de inmediato. Cuando el uso total de CPU es mucho más bajo que el objetivo, Spanner quita capacidad de procesamiento. Para obtener más información, consulta Cómo determinar el objetivo de uso total de CPU.
Objetivo de uso de almacenamiento	Es el porcentaje de almacenamiento en un nodo que puedes usar antes de que Spanner escale verticalmente. Este objetivo garantiza que siempre tengas suficiente capacidad de procesamiento para manejar las fluctuaciones en la cantidad de datos que almacenas. Este valor debe estar entre el 10% y el 99%. Para obtener más información, consulta Cómo determinar el objetivo de uso del almacenamiento.
Límite mínimo	Es la cantidad más baja de capacidad de procesamiento a la que Spanner reduce la escala de la instancia. El valor mínimo no puede ser inferior al 10% del valor que estableciste para el límite máximo. Por ejemplo, si el límite máximo es de 40 nodos, el límite mínimo debe ser de al menos 4 nodos. El requisito del 10% es un límite estricto. Para obtener más información, consulta Cómo determinar el límite mínimo.
Límite máximo	Es la cantidad más alta de capacidad de procesamiento a la que Spanner puede escalar la instancia. En el caso de los nodos, este valor debe ser mayor que 1 nodo (o 1,000 unidades de procesamiento) y debe ser igual o mayor que la cantidad mínima de nodos o unidades de procesamiento. El valor no puede ser más de 10 veces la cantidad mínima de capacidad de procesamiento que elijas. Este requisito de 10 veces es un límite estricto. Para obtener más información, consulta Cómo determinar el límite máximo.
Inhabilita la reducción de escala	Evita que el escalador automático reduzca la cantidad de nodos o unidades de procesamiento. Cuando se configura en `True`, se inhabilitan todos los comportamientos de reducción, incluida la reducción de instancias y de particiones de instancias. Esta opción solo se puede configurar con Google Cloud CLI. Para obtener más información, consulta Marcas y limitaciones de parámetros de Google Cloud CLI.

Configura el escalador automático administrado

En esta sección, se describe cómo determinar qué números elegir para los parámetros del ajustador automático administrado. Después de configurar los valores iniciales, supervisa tu instancia y ajusta los números si es necesario.

Determina el objetivo de uso de CPU de alta prioridad

El objetivo óptimo para tu instancia o partición de instancia depende de los requisitos de capacidad de procesamiento y latencia de tu carga de trabajo. Para ver nuestras recomendaciones sobre el uso máximo de CPU para las configuraciones de instancias regionales, birregionales y multirregionales, consulta Alertas para el uso de CPU elevado.

Cuando el uso de CPU está cerca del 100%o lo supera, es posible que se degrade el rendimiento. Si tu carga de trabajo es sensible a la latencia o al rendimiento, considera personalizar el objetivo de CPU total con un valor más bajo. Ten en cuenta que esto podría generar costos más altos.

En general, si observas una latencia inaceptablemente alta, debes reducir el objetivo de uso de CPU.

También puedes configurar objetivos para el uso de CPU total y de prioridad alta. Para obtener más información, consulta Cómo determinar ambos objetivos de uso de CPU.

Determina el objetivo de uso total de CPU

Cuando estableces el objetivo de uso total de CPU, Spanner ajusta automáticamente la escala para garantizar la capacidad suficiente para las tareas de prioridad alta, media y baja.

Si tus cargas de trabajo son sensibles a la latencia o si deseas que las tareas del sistema finalicen antes, debes establecer el objetivo de CPU total para garantizar que la instancia tenga capacidad suficiente. Cuando se establece el objetivo de CPU total, es posible que pagues más, pero tus aplicaciones brindarán una mejor experiencia a tus clientes.

Si se establece el objetivo de CPU total y sigues observando una latencia inaceptablemente alta, debes reducir el objetivo de uso de CPU total.

Para optimizar la capacidad de procesamiento de las escrituras y la creación de índices, recomendamos un objetivo de CPU total del 70% para las instancias regionales y del 50% para las instancias multirregionales. Esto también funciona bien durante la conmutación por error, si no se selecciona el destino de alta prioridad. Sin embargo, es posible que estos objetivos generen costos más altos. Si el costo es una preocupación, recomendamos un objetivo de CPU total del 85%. Esto proporciona una sobrecarga para absorber los picos sin activar la latencia causada por la saturación de recursos (uso del 100%).

De forma predeterminada, Spanner prioriza el tráfico que enfrenta el usuario limitando las operaciones en segundo plano que consumen muchos recursos (como la creación de índices). Puedes acelerar estas operaciones en segundo plano configurando un objetivo de uso de CPU total más bajo (por ejemplo, <=60%). Esto indica al escalador automático que aprovisione recursos de procesamiento adicionales, lo que aumenta la capacidad de procesamiento de las tareas del sistema. Sin embargo, esto podría aumentar los costos. Si deseas aumentar temporalmente la capacidad de procesamiento para la creación de índices, puedes establecer objetivos de CPU totales más bajos hasta que se complete la creación del índice.

También puedes configurar objetivos para el uso de CPU total y de prioridad alta. Para obtener más información, consulta Cómo determinar ambos objetivos de uso de CPU.

Determina ambos objetivos de uso de CPU

Si configuras objetivos para el uso total de CPU y el uso de CPU de alta prioridad, el escalador automático evalúa ambas métricas de forma simultánea. Luego, selecciona la mayor de las dos cantidades recomendadas de nodos o unidades de procesamiento. Esto garantiza que la instancia se escale verticalmente para satisfacer el requisito más exigente, lo que mantiene el rendimiento para las cargas de trabajo críticas mientras se completan las tareas en segundo plano.

Cuando se establecen los objetivos de uso de CPU de prioridad alta y de CPU total, el uso de CPU para las tareas de prioridad alta forma parte de ese total, junto con las tareas de prioridad baja y media. El valor del objetivo de uso de CPU de alta prioridad debe ser menor que el objetivo de uso de CPU total cuando se seleccionan ambas opciones.

En general, si observas una latencia inaceptablemente alta, debes reducir el objetivo de uso de CPU.

En general, recomendamos los siguientes objetivos de uso de CPU para una conmutación por error confiable:

Tipo de instancia	Objetivo de uso total de CPU	Objetivo de uso de CPU de alta prioridad
Instancia regional	70%	65%
Instancia multirregional	50%	45%

Según tu carga de trabajo, también recomendamos los siguientes objetivos de uso de CPU más específicos:

Tipo de carga de trabajo	Objetivos de CPU recomendados	Desventajas
Carga de trabajo con mucha carga de escritura y sensible a la capacidad de procesamiento	Objetivo de uso total de CPU: 70%	Mayor capacidad de procesamiento a expensas de la latencia
Carga de trabajo sensible a la latencia y con muchas lecturas	Objetivo de uso de CPU total: 80% Objetivo de uso de CPU de alta prioridad: 65% (regional) o 45% (multirregional)	Latencia de cola predecible a un costo más alto
Priorización de la carga de trabajo para lograr eficiencia en los costos	Objetivo de uso de CPU total: 85% Objetivo de uso de CPU de alta prioridad: 65% (regional) o 45% (multirregional)	Costo y rendimiento razonables con una posible demora en la creación del índice

Determina el objetivo de uso del almacenamiento

Para el ajuste de escala automático, el objetivo de uso de almacenamiento se expresa como un porcentaje por nodo. Para instancias o particiones de instancias de 1 nodo (1,000 unidades de procesamiento) y más grandes, el tamaño de almacenamiento está limitado a 10 TiB por nodo.

Cómo determinar el límite máximo

El valor que elijas como la cantidad máxima de capacidad de procesamiento es igual a la cantidad de capacidad de procesamiento que la instancia o la partición de instancia necesita para controlar el tráfico más pesado, incluso si no esperas alcanzar ese volumen la mayor parte del tiempo. Spanner nunca escala verticalmente a más capacidad de procesamiento de la que necesita. También puedes considerar esta cantidad como la mayor capacidad de procesamiento que estás dispuesto a pagar. Para obtener más información sobre los valores aceptados, consulta Parámetros del escalador automático.

El límite máximo debe permitir que se cumplan tanto el objetivo de uso de CPU como el objetivo de uso de almacenamiento que establezcas para el ajuste de escala automático.

Si cambias una instancia de asignación manual a ajuste de escala automático administrado, busca la mayor cantidad de capacidad de procesamiento que la instancia tuvo en los últimos uno o dos meses. El límite máximo del ajuste de escala automático administrado debe ser al menos igual de alto.
Si habilitas el escalador automático administrado para una instancia nueva, consulta las métricas de otras instancias y úsalas como guía cuando establezcas el límite máximo.
Si tienes una carga de trabajo nueva y no sabes cómo crecerá, puedes estimar la cantidad de capacidad de procesamiento que necesitas para cumplir con el objetivo de uso de almacenamiento integrado y, luego, ajustar el número más adelante.

También debes saber cuánta cuota queda en tu nodo, ya que el escalador automático administrado no puede configurar tu instancia para que tenga más capacidad de procesamiento que tu cuota. Para obtener más información, consulta Límites de nodos.

Después de que tu instancia esté en funcionamiento con el ajuste de escala automático habilitado, supervisa la instancia y asegúrate de que el valor que elegiste para el límite máximo sea al menos tan alto como el límite recomendado para el objetivo de CPU y el límite recomendado para el objetivo de almacenamiento.

Cómo determinar el límite mínimo

Puedes establecer un límite mínimo para el escalador automático administrado y garantizar que tu instancia o partición de instancia de Spanner pueda reducir la escala verticalmente al tamaño más pequeño y rentable. Spanner evita automáticamente que la cantidad de nodos disminuya por debajo del mínimo necesario para mantener los objetivos de uso de CPU y almacenamiento.

El valor mínimo más pequeño que permite el escalador automático administrado es 1 nodo o 1,000 unidades de procesamiento. Cuando habilitas el ajuste de escala automático para una instancia existente que tiene menos capacidad que el valor mínimo configurado para el escalador automático administrado, la instancia se ajusta automáticamente a este mínimo cuando la inicias.

Después de iniciar la instancia que tiene el ajuste de escala automático administrado, debes realizar una prueba inicial para asegurarte de que funcione con el tamaño mínimo establecido. Debes volver a realizar la prueba periódicamente para asegurarte de que siga funcionando según lo previsto.

Para obtener más información sobre los valores aceptados, consulta Parámetros del escalador automático administrado.

En muchos casos, querrás establecer el valor mínimo en más de uno. Elige una cantidad mayor o aumenta el límite mínimo para las siguientes situaciones:

Tienes un evento de escala máxima próximo en el que esperas que el tráfico aumente de forma temporal y deseas asegurarte de tener suficiente capacidad de procesamiento.
Tu aplicación envía tráfico con aumentos bruscos. Cuando agregas capacidad de procesamiento nueva, Spanner se rebalancea automáticamente para usar los nodos o las unidades de procesamiento nuevos. Debido a que este proceso puede tardar varios minutos, te recomendamos que adoptes un enfoque conservador y elijas un mínimo más alto. De esa manera, tu instancia se adaptará sin problemas a los aumentos repentinos.
Aumentas la capacidad de procesamiento máxima. El mínimo siempre debe ser el diez por ciento o más del objetivo de capacidad de procesamiento máxima. Por ejemplo, si estableces la cantidad máxima de nodos en 30, debes establecer la cantidad mínima de nodos en al menos 3.

Si aumentas el valor de la capacidad de procesamiento mínima en una instancia, Spanner intentará de inmediato ajustar la escala de la instancia al nuevo mínimo. Se aplican las restricciones estándar. Cuando te quedas sin cuota, falla tu solicitud para cambiar la configuración del escalador automático administrado y no se actualiza la configuración.

Después de configurar el escalador automático administrado por primera vez y, luego, de forma periódica, prueba tu instancia para asegurarte de que funcione con el tamaño mínimo.

Marcas y limitaciones de los parámetros de Google Cloud CLI

Cuando usas Google Cloud CLI para configurar el ajuste de escala automático administrado, hay algunas marcas obligatorias que debes establecer. Hay marcas opcionales que puedes usar para indicar si quieres usar nodos o unidades de procesamiento. Para obtener más información sobre cómo crear una instancia o una partición de instancia nuevas con el escalador automático administrado, o bien habilitar el escalador automático administrado en una instancia o partición de instancia existentes, consulta las siguientes guías prácticas:

Las siguientes marcas son obligatorias cuando habilitas el escalador automático administrado en tu instancia:

autoscaling-high-priority-cpu-percent
autoscaling-total-cpu-percent
autoscaling-storage-percent

Cuando configures el porcentaje de CPU, puedes seleccionar una o ambas opciones.

Si eliges usar nodos, también debes usar las dos siguientes marcas cuando habilites el escalador automático administrado:

autoscaling-min-nodes
autoscaling-max-nodes

Si eliges usar unidades de procesamiento, también debes usar las dos marcas siguientes cuando habilites el escalador automático administrado:

autoscaling-min-processing-units
autoscaling-max-processing-units

Puedes usar la marca booleana --disable-downscaling para evitar que el escalador automático reduzca la cantidad de nodos o unidades de procesamiento. Cuando se establece esta marca en true, el aumento de escala sigue funcionando con normalidad para satisfacer la mayor demanda. Para habilitar la reducción de escala después de inhabilitarla, usa --no-disable-downscaling flag.

Se aplican las siguientes limitaciones cuando se agrega el escalador automático administrado a una instancia existente con Google Cloud CLI:

No puedes usar la marca --nodes con las marcas --autoscaling-min-nodes o --autoscaling-max-nodes porque --nodes establece una cantidad específica de nodos en lugar de un rango de ajuste de escala. Del mismo modo, no puedes usar la marca --processing-units con las marcas autoscaling-min-processing-units o autoscaling-max-processing-units porque usar --processing-units establece una cantidad específica de unidades de procesamiento en lugar de un rango de ajuste.
No puedes mezclar las marcas de nodos y unidades de procesamiento. Por ejemplo, no puedes usar --autoscaling-max-nodes con autoscaling-min-processing-units.

Ajusta tu configuración

Supervisa el uso de la capacidad de procesamiento y ajusta la configuración si es necesario, en especial después de habilitar el escalador automático administrado por primera vez. Te recomendamos que uses la página Estadísticas del sistema en la consola de Google Cloud .

Escalado automático asimétrico de solo lectura

Después de habilitar el escalador automático administrado, también puedes habilitar y escalar automáticamente tus réplicas de solo lectura de forma independiente de otras réplicas. El ajuste de escala automático asimétrico de solo lectura te permite controlar los límites de capacidad de procesamiento y los objetivos de uso de CPU de tus regiones de solo lectura en función de su uso. Esto optimiza los patrones de tráfico de lectura local y mejora la eficiencia de costos. Los siguientes parámetros de configuración del ajuste de escala automático se pueden configurar para cada región de réplica de solo lectura:

Límite de capacidad de procesamiento mínima
Límite de capacidad de procesamiento máxima
Objetivo de uso de CPU de alta prioridad
Objetivo de uso total de CPU
Inhabilita la CPU total
Inhabilita la CPU de alta prioridad

Puedes habilitar el ajuste de escala automático asimétrico y configurar estos parámetros creando una instancia nueva o actualizando una instancia existente.

Para cada réplica, se aplican las siguientes reglas cuando habilitas el ajuste de escala automático asimétrico en una instancia existente:

Si la capacidad de procesamiento actual de la réplica se encuentra entre el mínimo y el máximo del ajuste de escala automático establecidos para la región, la capacidad de procesamiento de la réplica no cambia.
Si la capacidad de procesamiento actual de la réplica es inferior al mínimo de escalado automático establecido para la región, la capacidad de procesamiento se ajusta para que coincida con el mínimo de escalado automático.
Si la capacidad de procesamiento actual de la réplica supera el máximo del ajuste de escala automático establecido para la región, se ajusta la capacidad de procesamiento para que coincida con el máximo del ajuste de escala automático.
Si ambos objetivos de CPU se establecen en el nivel básico y deseas inhabilitar el objetivo de CPU en el nivel de la réplica, debes usar explícitamente disable_total_cpu_autoscaling o disable_high_priority_cpu_autoscaling.

Además, cuando se usa el escalador automático asimétrico, recomendamos establecer el mismo conjunto de objetivos en todas las réplicas para garantizar un comportamiento coherente del escalador automático durante los eventos de conmutación por error. Para obtener más información, consulta Consideraciones sobre la conmutación por error.

Problemas de conmutación por error

Para mantener la alta disponibilidad y el rendimiento durante una interrupción, debes asegurarte de que tu instancia tenga suficiente capacidad de procesamiento para controlar el tráfico si una zona (para instancias regionales) o una región completa (para instancias birregionales y multirregionales) deja de estar disponible.

Cuando se usa el escalador automático asimétrico, es fundamental aplicar los mismos objetivos de utilización en todas las réplicas. Las configuraciones incoherentes pueden generar cuellos de botella de capacidad durante una conmutación por error.

Considera la siguiente situación:

La réplica A está configurada con objetivos de CPU total y de alta prioridad.
La réplica B está configurada solo con un objetivo de CPU de alta prioridad.

Si una conmutación por error desplaza el tráfico de la réplica A a la réplica B, la réplica B solo se ajustará según las solicitudes de alta prioridad. Por lo tanto, las tareas de prioridad media y baja (como los procesos del sistema en segundo plano o las consultas analíticas) no activan el ajuste de escala automático necesario en la réplica B, lo que podría provocar la inanición de tareas o una mayor latencia para las cargas de trabajo no críticas.

Para evitar problemas, te recomendamos lo siguiente:

Siempre define objetivos idénticos del escalador automático en todas las réplicas para garantizar un comportamiento coherente del escalado automático. Por ejemplo, considera una situación en la que configuras una réplica de solo lectura con un objetivo de CPU de alta prioridad y un objetivo de CPU total. Si la réplica de lectura y escritura solo establece el objetivo de CPU de alta prioridad, durante la conmutación por error, el tráfico de prioridad media y baja no activará el ajuste de escala automático en la réplica de lectura y escritura.
Asegúrate de que la utilización objetivo tenga capacidad para los picos de tráfico que se producen cuando una réplica debe absorber repentinamente la carga de un par con errores.
Revisa periódicamente tus métricas de Cloud Monitoring para verificar que las réplicas secundarias tengan la capacidad necesaria para admitir el tráfico combinado de tu implementación principal.

Control de acceso

Para configurar el escalador automático administrado, debes ser un principal en un rol que tenga permisos de creación y actualización para la instancia o la partición de instancia que estás configurando.

Supervisión

Spanner proporciona varias métricas para ayudarte a comprender qué tan bien funciona el escalador automático administrado a medida que aumenta o reduce la escala verticalmente para satisfacer los requisitos de carga de trabajo. Las métricas también pueden ayudarte a medir si tu configuración es óptima para satisfacer los requisitos de costos y carga de trabajo de tu empresa. Por ejemplo, si observas que la cantidad de nodos de una instancia o partición de instancia suele estar cerca de la cantidad máxima de nodos, puedes considerar aumentar el máximo. Para obtener más información sobre cómo supervisar tus recursos de Spanner, consulta Supervisa instancias con Cloud Monitoring.

Las siguientes métricas se muestran en grafos en la página Estadísticas del sistema de la consola de Google Cloud . También puedes ver estas métricas con Cloud Monitoring.

spanner.googleapis.com/instance/autoscaling/min_node_count
spanner.googleapis.com/instance/autoscaling/max_node_count
spanner.googleapis.com/instance/autoscaling/min_processing_units
spanner.googleapis.com/instance/autoscaling/max_processing_units
spanner.googleapis.com/instance/autoscaling/high_priority_cpu_target_utilization
spanner.googleapis.com/instance/autoscaling/total_cpu_target_utilization
spanner.googleapis.com/instance/autoscaling/storage_target_utilization

Logging

Spanner crea un registro de auditoría de eventos del sistema cada vez que escala una instancia o una partición de instancia. Cada registro de eventos tiene texto de descripción y metadatos relacionados con el evento de ajuste de escala automático.

Visualiza registros en la página Estadísticas del sistema

Puedes ver los registros de eventos del sistema del escalador automático administrado en la consola deGoogle Cloud en la página Estadísticas del sistema.

En la consola de Google Cloud , abre Spanner:

Ir a Spanner
Selecciona la instancia o la partición de instancia habilitada para el ajuste de escala automático.
En el menú de navegación, haz clic en Estadísticas del sistema.
En la página Estadísticas del sistema, navega a la métrica Capacidad de procesamiento.
Haz clic en Ver registros para abrir el panel de registros.

En el panel Registros de capacidad de procesamiento, se muestran los registros de la última hora.

Si el ajuste de escala automático asimétrico de solo lectura está habilitado para tu instancia, el resumen del registro proporciona una descripción y la ubicación de cada cambio en la capacidad de procesamiento de las réplicas. Por ejemplo, Increased from 1 to 2 nodes in us-central1 to maintain high priority CPU utilization at 80%. Si no usas el ajuste de escala automático asimétrico, no se proporciona información de ubicación en el resumen del registro. Por ejemplo, Increased from 9 to 10 nodes to maintain high priority CPU utilization at 65%. También puedes ver cuándo se aumentan los nodos para mantener el objetivo de uso total de la CPU.

Visualiza registros con el Explorador de registros

También puedes ver los registros con el Explorador de registros:

En la consola de Google Cloud , abre el Explorador de registros:

Ir al Explorador de registros.
Selecciona el proyecto Google Cloud adecuado.

En el campo Consulta, ingresa lo siguiente:

 protoPayload.methodName="AutoscaleInstance"

Puedes agregar la siguiente consulta para filtrar aún más los registros:

resource.type="spanner_instance"
resource.labels.instance_id=INSTANCE_ID
resource.labels.project_id=PROJECT_ID
logName="projects/PROJECT_ID/logs/cloudaudit.googleapis.com%2Fsystem_event"
protoPayload.methodName="AutoscaleInstance"

Para ver los registros de las consultas que se ejecutan en una partición de instancia no predeterminada, ingresa lo siguiente:

resource.type="spanner_instance"
resource.labels.instance_id=INSTANCE_ID
resource.labels.project_id=PROJECT_ID
logName="projects/PROJECT_ID/logs/cloudaudit.googleapis.com%2Fsystem_event"
protoPayload.methodName="AutoscaleInstancePartition"

Haz clic en Ejecutar consulta.

En el panel Resultados de la consulta, se muestran los registros de la última hora.

Para obtener más información sobre cómo ver los registros, consulta Cloud Logging. Puedes configurar alertas basadas en registros en la página Explorador de registros en la consola de Google Cloud o con la API de Cloud Monitoring.

¿Qué sigue?

Obtén información para crear una instancia con el escalador automático administrado habilitado
Obtén información para modificar una instancia para usar el ajuste de escala automático o cambiar la configuración del ajuste de escala automático
Obtén información para cambiar una instancia del uso del ajuste de escala automático al ajuste de escala manual
Obtén información para crear una partición de instancias con el escalador automático administrado habilitado
Aprende a modificar una partición de instancias para usar el ajuste de escala automático o cambiar la configuración del ajuste de escala automático