Usar el centro de salud

Disponible en:

SecOps de Google SIEM

En este documento se describe el centro de control de estado, que es la ubicación central de Google Security Operations donde puedes monitorizar el estado de todas las fuentes de datos configuradas. El centro de control de estado proporciona información crucial sobre las fuentes y los tipos de registros que han fallado, así como el contexto necesario para diagnosticar y solucionar los problemas de la canalización de datos.

El Centro de salud incluye información sobre lo siguiente:

Volúmenes y estado de la ingestión.
Volúmenes de análisis de registros sin procesar a eventos del modelo de datos unificado (UDM).
Contexto y enlaces a interfaces con información y funciones relevantes adicionales.
Fuentes y tipos de registro fallidos. El centro de control de estado detecta los fallos por cliente.

Principales ventajas

Puedes usar el centro de salud para hacer lo siguiente:

Supervisa el estado general de los datos de un vistazo. Consulte el estado de salud principal y las métricas asociadas de cada feed, fuente de datos, tipo de registro y fuente (es decir, el ID del feed).
Monitoriza las métricas agregadas de estado de los datos de la ingesta y el análisis a lo largo del tiempo con eventos destacados que enlazan a paneles de control filtrados.
Acceder a los paneles de control relacionados, filtrados por periodo, tipo de registro o feed.
Acceda a la configuración del feed para editar y solucionar un problema.
Accede a la configuración del analizador para editar y corregir o solucionar un problema.
Haz clic en el enlace Configurar alertas para abrir la interfaz de Cloud Monitoring y, desde ahí, configura alertas personalizadas basadas en APIs mediante las métricas Estado y de volumen de registros.

Preguntas clave

En esta sección se hace referencia a los componentes y parámetros de Health Hub, que se describen en la sección Interfaz.

Puedes usar el centro de salud para responder a las siguientes preguntas sobre tu canalización de datos:

¿Cuáles fueron las últimas ejecuciones de mi feed o los últimos errores de mi analizador?

El centro de control de estado tiene un panel de control detallado que muestra las últimas 200 ejecuciones de feeds y los últimos 200 errores del analizador de la fila específica en la que hagas clic.
¿Mis registros llegan a Google SecOps?

Para comprobar si los registros llegan a Google SecOps, puedes usar las métricas Última ingestión y Última normalización. Estas métricas confirman la última vez que se enviaron los datos correctamente. Además, las métricas de volumen de ingesta (por fuente y por tipo de registro) muestran la cantidad de datos que se está ingiriendo.
¿Se están analizando mis registros correctamente?

Para confirmar que el análisis es correcto, consulta la métrica Última normalización. Esta métrica indica cuándo se produjo la última transformación correcta de un registro sin procesar en un evento de UDM.
¿Por qué no se produce la ingestión o el análisis?

El texto de la columna Últimos detalles del problema identifica problemas específicos, lo que te ayuda a determinar si la acción es aplicable (tú la solucionas) o no aplicable (requiere asistencia). El texto Forbidden 403: Permission denied (Prohibido 403: permiso denegado) es un ejemplo de error que requiere una acción, en el que la cuenta de autenticación proporcionada en la configuración del feed no tiene los permisos necesarios. El texto Internal_error es un ejemplo de error no procesable, en el que la acción recomendada es abrir un caso de asistencia con Google SecOps.
¿Hay cambios significativos en el número de registros ingeridos y analizados?

El campo Estado muestra el estado de los datos (Correcto o Error) en función del volumen de datos. También puede identificar aumentos o descensos repentinos o sostenidos consultando el gráfico Registros ingeridos totales.
¿Cómo puedo recibir alertas si mis fuentes fallan?

El centro de control de estado envía las métricas de estado y de volumen de registros a Cloud Monitoring. En una de las tablas de Centro de estado, haga clic en el enlace Alertas correspondiente para abrir la interfaz de Cloud Monitoring. En esa sección, puede configurar alertas personalizadas basadas en APIs mediante las métricas Estado y volumen de registros.
¿Cómo puedo inferir un retraso en la ingesta de un tipo de registro?

Se indica un retraso cuando el valor de Hora del último evento es significativamente anterior a la marca de tiempo Última ingestión. El centro de control de estado muestra el percentil 95^th de la diferencia entre Última ingestión y Hora del último evento por tipo de registro. Un valor alto sugiere que hay un problema de latencia en la canalización de Google SecOps, mientras que un valor normal puede indicar que la fuente está enviando datos antiguos.
¿Los cambios recientes en mi configuración han provocado errores en el feed?

Si la marca de tiempo Config Last Updated es similar a la marca de tiempo Last Ingested, significa que una actualización de configuración reciente puede ser la causa del fallo. Esta correlación ayuda a analizar las causas principales.
¿Cómo ha evolucionado el estado de la ingestión y el análisis a lo largo del tiempo?

Los gráficos Resumen del estado de las fuentes de datos, Resumen del estado del análisis y Total de registros ingeridos muestran la tendencia histórica del estado de tus datos, lo que te permite observar patrones a largo plazo.

Interfaz

Para abrir el centro de salud, en el menú de navegación lateral, haz clic en Centro de salud.

El centro de salud es un panel de control predeterminado de solo lectura y no se puede modificar directamente. Para personalizarlo, crea una copia del centro de salud y, a continuación, modifica el panel de control duplicado para adaptarlo a tu caso práctico específico.

En el centro de control de estado se muestran los siguientes widgets:

Widgets de número grande:
- Fuentes correctas: el número de fuentes de datos que funcionan sin errores.
- Fuentes fallidas: el número de fuentes de datos que requieren atención inmediata.
- Analizadores correctos: número de analizadores que funcionan sin errores.
- Analizadores fallidos: el número de analizadores que requieren atención inmediata.
Resumen del estado de las fuentes de datos: un gráfico de líneas que muestra las curvas de Fuentes de datos correctas y Fuentes de datos críticas por día a lo largo del tiempo.
Análisis de la vista general del estado: un gráfico de líneas que muestra las curvas de Correcto y Crítico de los analizadores por día a lo largo del tiempo.
Total de registros insertados: gráfico de líneas que muestra la curva de registros insertados por día a lo largo del tiempo.

Nota: Algunos registros insertados se asignan a más de un registro normalizado. El recuento total de registros analizados puede ser superior al recuento total de registros insertados.
Error del analizador por tipo de registro: un gráfico de líneas que muestra una curva por cada analizador con un estado de salud crítico, por día a lo largo del tiempo. En este contexto, el estado de salud crítico se debe a una tasa de éxito de análisis muy baja.
Tabla Estado de salud por fuente de datos: incluye las siguientes columnas:
- Estado: el estado acumulativo del feed (Correcto o Con errores), derivado del volumen de datos, los errores de configuración y los errores de la API.
- Tipo de fuente: el tipo de fuente (mecanismo de ingestión). Por ejemplo, API Ingestion, Feeds, Native Workspace Ingestion o Azure Event Hub Feeds.
- Nombre: el nombre del feed.
- Tipo de registro: el tipo de registro, como CS_EDR, UDM, GCP_CLOUDAUDIT o WINEVTLOG.
- Detalles del problema más reciente: los detalles del problema más reciente en el periodo especificado. Por ejemplo, Error al analizar los registros, Problema con las credenciales de configuración o Problema de normalización. El problema indicado puede ser accionable (por ejemplo, Incorrect Auth) o no accionable (por ejemplo, Internal_error). Si no se puede tomar ninguna medida, la acción recomendada es abrir un caso de asistencia con Google SecOps. Si no ha habido ningún problema en el periodo especificado, el valor estará vacío o mostrará OK.
- Duración del problema: número de días que la fuente de datos ha estado en estado de error. Si el estado es Correcto, el valor está vacío o muestra N/A.
- Última recogida: marca de tiempo de la última recogida de datos.
- Última ingestión: marca de tiempo de la última ingestión correcta. Usa esta métrica para identificar si tus registros llegan a Google SecOps.
- Última actualización de la configuración: marca de tiempo del último cambio realizado en la métrica. Use este valor para correlacionar las actualizaciones de configuración con los errores observados, lo que le ayudará a determinar la causa raíz de los problemas de ingesta o de análisis.
- Ver detalles de la ingesta: enlace que abre una nueva pestaña con otro panel de control, que contiene información histórica adicional para realizar un análisis más detallado.
- Editar fuente de datos: enlace que abre una nueva pestaña con la configuración del feed correspondiente, donde puede corregir los errores relacionados con la configuración.
- Configurar alertas: enlace que abre una nueva pestaña con la interfaz de Cloud Monitoring correspondiente.
Tabla Estado de salud por analizador: incluye las siguientes columnas:
- Estado: el estado acumulativo del tipo de registro (Correcto o Fallido).
- Porcentaje de errores de análisis: porcentaje de registros del tipo correspondiente que no se han analizado.
- Tipo de registro: el tipo de registro (por ejemplo, DNS, USER, GENERIC, AZURE_AD, BIND_DNS, GCP SECURITYCENTER THREAT o WEBPROXY).
- Detalles del problema más reciente: los detalles sobre el problema de análisis más reciente en el periodo especificado (por ejemplo, Registros de análisis fallidos, Problema con las credenciales de configuración o Problema de normalización). El problema indicado puede ser accionable (por ejemplo, Incorrect Auth) o no accionable (por ejemplo, Internal_error). Si no se puede tomar ninguna medida, la acción recomendada es abrir un caso de asistencia con Google SecOps. Si no ha habido ningún problema en el periodo especificado, el valor estará vacío o mostrará OK.
- Duración del problema: número de días que la fuente de datos ha estado en estado de error. Si el Estado es Correcto, el valor está vacío.
- Última ingestión: marca de tiempo de la última ingestión correcta. Puede usar esta métrica para determinar si los registros llegan a Google SecOps.
- Hora del último evento: marca de tiempo del último registro normalizado.
  
  Nota: El valor siempre es la marca de tiempo más reciente>, aunque se ingiera un evento anterior más tarde.
- Última normalización: marca de tiempo de la última acción de análisis y normalización del tipo de registro. Puede usar esta métrica para determinar si los registros sin procesar se han transformado correctamente en eventos de UDM.
- Última actualización de la configuración: marca de tiempo del último cambio realizado en la métrica. Use este valor para correlacionar las actualizaciones de configuración con los errores observados, lo que le ayudará a determinar la causa raíz de los problemas de ingesta o de análisis.
- Ver detalles del análisis: enlace que abre una nueva pestaña con otro panel de control que contiene información histórica adicional para realizar un análisis más detallado.
- Editar analizador: enlace que abre una pestaña nueva con la configuración del analizador correspondiente, donde puede corregir los errores relacionados con la configuración.
- Configurar alerta: enlace que abre una nueva pestaña con la interfaz de Cloud Monitoring correspondiente.

Motor de detección de irregularidades

El centro de control de estado usa el motor de detección de irregularidades de SecOps de Google para identificar automáticamente los cambios significativos en sus datos, lo que le permite detectar y solucionar rápidamente posibles problemas.

Detección de irregularidades en la ingestión de datos

Google SecOps analiza los cambios de volumen diarios y tiene en cuenta los patrones semanales normales.

El motor de detección de irregularidades usa los siguientes cálculos para detectar aumentos o descensos inusuales en la ingesta de datos:

Comparaciones diarias y semanales: Google SecOps calcula la diferencia en el volumen de ingesta entre el día actual y el anterior, así como la diferencia entre el día actual y el volumen medio de la semana anterior.
Estandarización: para comprender la importancia de estos cambios, Google SecOps los estandariza mediante la siguiente fórmula de puntuación Z:

z = (x_i − x_bar) / stdev

donde
- z es la puntuación estandarizada (o puntuación Z) de una diferencia individual.
- x_i es un valor de diferencia individual
- x_bar es la media de las diferencias
- stdev es la desviación estándar de las diferencias
Detección de irregularidades: Google SecOps detecta una irregularidad si los cambios estandarizados diarios y semanales son estadísticamente significativos. En concreto, Google SecOps busca lo siguiente:
- Descensos: tanto la diferencia estandarizada diaria como la semanal son inferiores a -1,645.
- Picos: tanto la diferencia estandarizada diaria como la semanal son superiores a 1,645.

Ratio de normalización

Al calcular la proporción de eventos ingeridos con respecto a los eventos normalizados, el motor de detección de irregularidades usa un enfoque combinado para asegurarse de que solo se marquen las caídas significativas en las tasas de normalización. El motor de detección de irregularidades genera una alerta solo cuando se cumplen las dos condiciones siguientes:

Se ha producido un descenso estadísticamente significativo en la proporción de normalización en comparación con el día anterior.
La bajada también es significativa en términos absolutos, con una magnitud de 0,05 o más.

Detección de irregularidades en errores de análisis

En el caso de los errores que se producen durante el análisis de datos, el motor de detección de irregularidades usa un método basado en ratios. El motor de detección de irregularidades activa una alerta si la proporción de errores del analizador en relación con el número total de eventos ingeridos aumenta en 5 puntos porcentuales o más en comparación con el día anterior.

Siguientes pasos

¿Necesitas más ayuda? Recibe respuestas de los miembros de la comunidad y de los profesionales de Google SecOps.