Analizar el rendimiento de las consultas

En esta página, se describe cómo usar el panel de Estadísticas de consultas para detectar y analizar problemas de rendimiento de Spanner.

Descripción general de las estadísticas de consultas

Las estadísticas de consultas te ayudan a detectar y diagnosticar problemas de rendimiento de consultas y de instrucciones DML (INSERT, UPDATE, y DELETE) para una base de datos de Spanner. Admiten la supervisión intuitiva y proporcionan información de diagnóstico que te ayuda a ir más allá de la detección para identificar la causa raíz de los problemas de rendimiento.

Las estadísticas de consultas te ayudan a mejorar el rendimiento de las consultas de Spanner mediante la orientación a través de los siguientes pasos:

  1. Determina si las consultas ineficientes causan un uso de CPU elevado.
  2. Identifica una búsqueda o etiqueta que podría ser problemática.
  3. Analiza la consulta o la etiqueta de solicitud para identificar problemas.

Las estadísticas de consultas están disponibles en configuraciones regionales y multirregionales.

Precios

No hay costo adicional por Estadísticas de consultas.

Retención de datos

Las estadísticas de consultas retienen datos durante un máximo de 30 días. Para el gráfico Uso de CPU total (por etiqueta de consulta o solicitud), Spanner recupera datos de las tablas SPANNER_SYS.QUERY_STATS_TOP_*. Estas tablas tienen una retención máxima de 30 días. Consulta Retención de datos para obtener más información.

Roles obligatorios

Necesitas diferentes roles y permisos de IAM según si eres un usuario de IAM o un usuario de control de acceso detallado.

Usuario de Identity and Access Management (IAM)

Para obtener los permisos que necesitas para ver la página de Estadísticas de consultas, pídele a tu administrador que te otorgue los siguientes roles de IAM en la instancia:

Se requieren los siguientes permisos en el rol Lector de base de datos de Cloud Spanner(roles/spanner.databaseReader) para ver la página de Estadísticas de consultas:

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

Usuario de control de acceso detallado

Si eres un usuario de control de acceso detallado, verifica lo siguiente:

  • Tienes el Visualizador de Cloud Spanner(roles/spanner.viewer).
  • Tienes privilegios de control de acceso detallado y se te otorga el rol del sistema spanner_sys_reader o uno de sus roles miembros.
  • Selecciona spanner_sys_reader o un rol miembro como tu rol del sistema actual en la página de descripción general de la base de datos.

Para obtener más información, consulta Información sobre el control de acceso detallado y Roles del sistema de control de acceso detallado.

El panel de Estadísticas de consultas

En el panel de Estadísticas de consultas, se muestra la carga de consultas según la base de datos y el intervalo de tiempo que selecciones. La carga de consultas es una medición del uso de CPU total para todas las consultas en la instancia del intervalo de tiempo seleccionado. En el panel, se proporciona una serie de filtros que te ayudan a ver la carga de consultas.

Para ver el panel de Estadísticas de consultas de una base de datos, haz lo siguiente:

  1. Selecciona Estadísticas de consultas en el panel de navegación izquierdo. Se abrirá el panel de Estadísticas de consultas.
  2. Selecciona una base de datos de la lista Bases de datos. En el panel, se muestra la información de carga de consultas de la base de datos.

Las áreas del panel incluyen:

  1. Lista de bases de datos: Filtra la carga de consultas en una base de datos específica o en todas las bases de datos.
  2. Filtro de intervalo de tiempo: Filtra la carga de consultas por intervalos de tiempo, como horas, días o un intervalo personalizado.
  3. Gráfico de uso de CPU total (todas las consultas): Muestra la tasa promedio agregada de uso de CPU (en segundos de CPU por minuto) de todas las consultas.
  4. Gráfico de uso de CPU total (por etiqueta de consulta o solicitud): Muestra la tasa promedio de uso de CPU (en segundos de CPU por minuto) por cada etiqueta de consulta o solicitud.
  5. Tabla de consultas y etiquetas principales: Muestra la lista de consultas principales y etiquetas de solicitud ordenadas por uso de CPU. Consulta Identifica una búsqueda o etiqueta que podría ser problemática.

Panel de estadísticas de consultas

Rendimiento del panel

Usa parámetros de consulta o etiqueta tus consultas para optimizar el rendimiento de Estadísticas de consultas. Si no parametrizas ni etiquetas tus consultas, es posible que se muestren demasiados resultados, lo que podría provocar que la tabla de consultas y etiquetas principales no se cargue correctamente.

Confirma si las consultas ineficientes son responsables del uso de CPU elevado

El uso de CPU total es una medida de la tasa promedio de uso de CPU (en segundos de CPU por minuto) que realizan las consultas ejecutadas en la base de datos seleccionada a lo largo del tiempo.

Uso total de CPU para todas las consultas

Revisa el gráfico para explorar estas preguntas:

  • ¿Qué base de datos experimenta la carga? Selecciona bases de datos diferentes en la lista Bases de datos para encontrar las bases de datos con las cargas más altas. Para averiguar qué base de datos tiene la carga más alta, también puedes revisar el gráfico Uso de CPU: total de las bases de datos en la Google Cloud consola.

    Cargar base de datos

  • ¿El uso de CPU es alto? ¿El grafo aumenta o se incrementa con el tiempo? Si no ves un uso de CPU alto, entonces el problema no está en tus consultas.

  • ¿Cuánto tiempo ha estado alto el uso de CPU? ¿Aumentó recientemente o ha sido alto de manera constante durante un tiempo? Usa el selector de intervalo de tiempo para seleccionar varios períodos para averiguar cuánto tiempo ha durado el problema. Acerca la vista para ver un período en el que se observan los aumentos repentinos de la carga de consultas. Aléjate a fin de ver hasta una semana del cronograma.

Si ves un aumento o una elevación en el gráfico correspondiente al uso general de CPU de la instancia, es muy probable que se deba a una o más consultas costosas. A continuación, puedes profundizar en el proceso de depuración identificando una consulta o una etiqueta de solicitud que podría ser problemática.

Identifica una búsqueda o etiqueta de solicitud que podría ser problemática

Para identificar una consulta o una etiqueta de solicitud que podría ser problemática, observa la sección Consultas principales:

Consultas de TopN

Aquí vemos que la consulta con la huella digital 3216067328234137024 tiene un uso de CPU elevado y puede ser problemática.

En la tabla Consultas principales , se proporciona una descripción general de las consultas que usan más CPU durante el período elegido, ordenadas de mayor a menor. La cantidad de consultas principales se limita a 100.

Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas principales, que tiene tres granularidades diferentes: 1 min, 10 min y 1 hora. El valor de cada punto de datos en los gráficos representa el valor promedio durante un intervalo de un minuto.

Te recomendamos que agregues etiquetas a tus consultas de SQL. El etiquetado de consultas te ayuda a encontrar problemas en construcciones de nivel superior, como la lógica empresarial o un microservicio.

Tabla de consultas de TopN

En la tabla, se muestran las siguientes propiedades:

  • Huella digital: Es el hash de la etiqueta de solicitud o, si la etiqueta no está presente, un hash del texto de la consulta.
  • Etiqueta de consulta o solicitud: Si la consulta tiene una etiqueta asociada, se muestra la etiqueta de solicitud. Las estadísticas de varias consultas que tienen la misma cadena de etiquetas se agrupan en una sola fila con el valor REQUEST_TAG que coincide con la cadena de etiquetas. Para obtener más información sobre el uso de etiquetas de solicitud, consulta Solución de problemas con etiquetas de solicitud y etiquetas de transacción.

    Si la consulta no tiene una etiqueta asociada, se muestra la consulta en SQL, truncada a aproximadamente 64 KB. Para el DML por lotes, las instrucciones de SQL se aplanan en una sola fila y se concatenan con un delimitador de punto y coma. Los textos de SQL idénticos consecutivos se anulan antes de truncar.

  • Tipo de consulta: Indica si una consulta es PARTITIONED_QUERY o QUERY. Una PARTITIONED_QUERY es una consulta con un partitionToken obtenido de la API de PartitionQuery. Todas las demás consultas y las instrucciones DML se indican con el tipo de consulta QUERY.

  • Uso de CPU: Es el consumo de recursos de CPU por una consulta, como un porcentaje de los recursos de CPU totales que usan todas las consultas que se ejecutan en las bases de datos en ese intervalo de tiempo, que se muestra en una barra horizontal que tiene un rango de 0 a 100.

  • Recomendación: Spanner analiza tus consultas para determinar si pueden beneficiarse de índices mejorados. Si es así, recomienda índices nuevos o modificados que pueden mejorar el rendimiento de las consultas. Para obtener más información, consulta Usa el asesor de índices de Spanner.

  • CPU (%): Es el consumo de recursos de CPU por una consulta, como un porcentaje de los recursos de CPU totales que usan todas las consultas que se ejecutan en las bases de datos en ese intervalo de tiempo.

  • Recuento de ejecuciones: Es la tasa promedio de ejecuciones de consultas, en ejecuciones por minuto, que Spanner vio durante el intervalo.

  • Latencia promedio (ms): Es el promedio de tiempo, en microsegundos, para cada ejecución de consulta dentro de la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados, así como la sobrecarga.

  • Promedio de filas analizadas: Es el promedio de filas que analizó la consulta, sin incluir los valores borrados.

  • Promedio de filas mostradas: Es el promedio de filas que mostró la consulta.

  • Bytes mostrados: Es la cantidad de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.

Posible variación entre los gráficos

Es posible que observes alguna variación entre el gráfico Uso de CPU total (todas las consultas) y el gráfico Uso de CPU total (por etiqueta de consulta o solicitud). Existen dos motivos por los que esto puede ocurrir:

  • Diferentes fuentes de datos: Los datos de Cloud Monitoring, que alimentan el gráfico Uso de CPU total (todas las consultas), suelen ser más precisos porque se envían cada minuto y tienen un período de retención de 45 días. Por otro lado, los datos de la tabla del sistema, que alimentan el gráfico Uso de CPU total (por etiqueta de consulta o solicitud), pueden promediarse durante 10 minutos (o 1 hora), en cuyo caso podríamos perder datos de alta granularidad que vemos en el gráfico Uso de CPU total (todas las consultas).

  • Diferentes períodos de agregación: Ambos gráficos tienen diferentes períodos de agregación. Por ejemplo, cuando inspeccionamos un evento de más de 6 horas, consultamos la tabla SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE. En este caso, un evento que ocurre a las 10:01 se agregaría durante 10 minutos y estaría presente en la tabla del sistema correspondiente a la marca de tiempo de las 10:10.

En la siguiente captura de pantalla, se muestra un ejemplo de esta variación.

Varianza entre gráficos

Analiza una consulta o una etiqueta de solicitud específica

Para determinar si una consulta o una etiqueta de solicitud es la causa raíz del problema, haz clic en la consulta o la etiqueta de solicitud que parece que tiene la carga más alta o que tarda más tiempo que las otras. Puedes seleccionar varias consultas y etiquetas de solicitud a la vez.

Puedes mantener el puntero del mouse sobre el gráfico de consultas en el cronograma para conocer su uso de CPU (en segundos).

Revisa la siguiente información para tratar de reducir el problema:

  • ¿Cuánto tiempo ha estado alta la carga? ¿Es solo alta ahora? ¿Ha estado alta por mucho tiempo? Cambia los intervalos de tiempo para encontrar la fecha y la hora en que la consulta comenzó a tener un rendimiento deficiente.
  • ¿Hubo aumentos repentinos en el uso de CPU? Puedes cambiar el período para estudiar el uso de CPU histórico de la consulta.
  • ¿Cuál es el consumo de recursos? ¿Qué relación tiene con otras consultas? Observa la tabla y compara los datos de otras consultas con la seleccionada. ¿Hay una diferencia importante?

Para confirmar que la consulta seleccionada contribuye al uso de CPU elevado, puedes desglosar los detalles de la forma de consulta específica (o etiqueta de solicitud) y analizarlos más en la página de detalles de la consulta.

Visualiza la página de detalles de la consulta

Para ver los detalles de una forma de consulta o etiqueta de solicitud específica en forma gráfica, haz clic en la huella digital asociada con la consulta o la etiqueta de solicitud. Se abrirá la página Detalles de la consulta.

Página de detalles de la búsqueda

En la página de detalles de la consulta, se muestra la siguiente información:

  1. Texto de detalles de la consulta: Texto de consulta en SQL, truncado a aproximadamente 64 KB. Las estadísticas de varias consultas que tienen la misma cadena de etiquetas se agrupan en una sola fila con el valor REQUEST_TAG que coincide con esa cadena. Solo el texto de una de esas consultas se muestra en este campo. Para el DML por lotes, el conjunto de instrucciones de SQL se aplanan en una sola fila y se concatenan con un delimitador de punto y coma. Los textos de SQL idénticos consecutivos se anulan antes de truncar.
  2. Los valores de los siguientes campos:
    • Recuento de ejecuciones: Es la tasa promedio de ejecuciones de consultas, en ejecuciones por minuto, que Spanner vio durante el intervalo.
    • CPU promedio (ms): Es el consumo promedio de recursos de CPU, en milisegundos, por una consulta de los recursos de CPU de la instancia en un intervalo de tiempo.
    • Latencia promedio (ms): Es el promedio de tiempo, en milisegundos, para cada ejecución de consulta dentro de la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados, así como la sobrecarga.
    • Promedio de filas mostradas: Es el promedio de filas que mostró la consulta.
    • Promedio de filas analizadas: Es el promedio de filas que analizó la consulta, sin incluir los valores borrados.
    • Bytes promedio: Es la cantidad de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
  3. Gráfico de muestras de planes de consultas: Cada punto del gráfico representa un plan de consultas muestreado en un momento específico y su latencia de consulta específica. Haz clic en uno de los puntos del gráfico para ver el plan de consultas y conocer los pasos que se realizaron durante la ejecución de la consulta. Nota: Los planes de consultas no son compatibles con las consultas con partitionTokens obtenidos de la API de PartitionQuery y consultas de DML particionadas.
  4. Visualizador de planes de consultas: Muestra el plan de consultas muestreado seleccionado. Spanner proporciona las siguientes opciones de diseño:

    • Vista de árbol: La vista de árbol visualiza el plan de consultas como un gráfico en el que cada nodo o tarjeta representa un iterador que consume filas de sus entradas y produce filas a su elemento superior. Puedes hacer clic en cada iterador para obtener información expandida.
    • Vista secuencial: La vista secuencial visualiza el plan de consultas en una tabla jerárquica en la que cada fila representa un operador. Puedes hacer clic en cada fila para obtener información expandida.

      Vista secuencial de un plan de consultas

      En la tabla, se muestran las siguientes columnas:

      • Nombre: Es el nombre del operador.
      • Grupo de máquinas: Es el grupo de máquinas en el que se ejecutó este operador.
      • Latencia: Es la cantidad de tiempo transcurrido durante la ejecución de la operación actual. Podría ser mayor que el tiempo de CPU (por ejemplo, si el operador esperó llamadas remotas o si hubo una demora en el sistema de archivos).
      • Latencia acumulativa: Es la cantidad de tiempo transcurrido durante la ejecución de todo el subárbol asociado a este operador. Esto no incluye el tiempo de creación del plan ni otras sobrecargas, por lo que la latencia acumulativa puede ser menor que la duración total de la consulta.
      • Tiempo de CPU: Es la cantidad total de tiempo de CPU dedicado a ejecutar la consulta. Se excluye la latencia de red. Algunas partes de la ejecución de la consulta pueden continuar de forma paralela, por lo que es posible que el tiempo de CPU sea mayor que el tiempo total transcurrido. Por ejemplo, si una consulta ejecuta diez operaciones paralelas en 1 milisegundo (ms), el tiempo transcurrido es de 1 ms, pero el tiempo de CPU es de 10 ms.
      • Filas mostradas: Es la cantidad de filas que devuelve el operador.
  5. Gráfico de latencia de consultas: Muestra el valor de la latencia de consultas para una consulta seleccionada durante un período. También muestra la latencia promedio.

  6. Gráfico de uso de CPU: Muestra el uso de CPU por una consulta, en porcentaje, durante un período. También muestra el uso de CPU promedio.

  7. Gráfico de recuento de ejecuciones/errores: Muestra la tasa promedio de ejecuciones de consultas (en ejecuciones por minuto) durante un período y la tasa promedio de ejecuciones de consultas fallidas (en ejecuciones fallidas por minuto).

  8. Gráfico de filas analizadas: Muestra la cantidad de filas que analizó la consulta durante un período.

  9. Gráfico de filas mostradas: Muestra la cantidad de filas que mostró la consulta durante un período.

  10. Filtro de intervalo de tiempo: Filtra los detalles de la consulta por intervalos de tiempo, como hora, día o un intervalo personalizado.

Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas principales, que tiene tres granularidades diferentes: 1 min, 10 min y 1 hora. El valor de cada punto de datos en los gráficos representa el valor promedio durante un intervalo de un minuto.

Busca todas las ejecuciones de una consulta en el registro de auditoría

Para buscar todas las ejecuciones de una huella digital de consulta en particular en Registros de auditoría de Cloud, consulta el registro de auditoría y busca cualquier query_fingerprint que coincida con el Fingerprint campo en la tabla de estadísticas de consultas principales. Para obtener más información, consulta la Descripción general de la consulta y la visualización de registros. Usa este método para identificar al usuario que inició la consulta.

¿Qué sigue?