Eventos y políticas de mantenimiento

Para mantener actualizadas tus instancias de Google Cloud Managed Lustre, Google Cloudse realiza mantenimiento periódico en ellas. Los eventos de mantenimiento pueden incluir actualizaciones del software o la infraestructura subyacentes. Estos eventos pueden causar un tiempo de inactividad temporal, durante el cual es posible que las operaciones de E/S en la instancia dejen de responder. Las operaciones de E/S afectadas se reanudan una vez que se completa el mantenimiento. El tiempo de inactividad suele ser de entre 2 y 25 minutos.

Mientras el mantenimiento está en curso, el estado de una instancia es UPGRADING. Una vez que se completa el mantenimiento, la instancia vuelve al estado ACTIVE.

Las políticas de mantenimiento te permiten controlar cuándo ocurren estos eventos de mantenimiento. Puedes configurar una política de mantenimiento para cada instancia y especificar períodos de mantenimiento y períodos en los que se debe excluir el mantenimiento. Si no se configura ninguna política de mantenimiento en una instancia, el mantenimiento puede ocurrir en cualquier momento.

También puedes reprogramar un evento de mantenimiento para que comience de inmediato, durante el próximo período disponible o en un momento específico hasta 28 días después.

Instancias de escala extrema

Es posible que algunas configuraciones de Managed Lustre que proporcionan un rendimiento y una escala extremos requieran un tiempo de inactividad planificado de hasta 4 horas para el mantenimiento periódico del host. Google coordina estos eventos de mantenimiento contigo con anticipación.

Acerca de las políticas de mantenimiento

Puedes configurar una política de mantenimiento en cada instancia de Managed Lustre. Una política de mantenimiento incluye lo siguiente:

  • Período de mantenimiento semanal: Es un período recurrente de una hora durante la semana en el que se permite que Managed Lustre inicie un evento de mantenimiento.
  • Período de exclusión de mantenimiento: Es un período durante el cual Managed Lustre no puede iniciar un evento de mantenimiento. Puedes definir una ventana de exclusión por instancia, con una duración máxima de dos semanas. Si no se especifica ningún año en las fechas de inicio y finalización, el período de exclusión se repite anualmente.

Un período de exclusión tiene prioridad sobre un período de mantenimiento normal. Si un evento programado se produce durante este período, Lustre administrado aplaza el evento hasta el siguiente período disponible o lo omite por completo. La actualización se aplica durante el siguiente ciclo de mantenimiento.

Notificaciones de mantenimiento

Puedes suscribirte a las notificaciones por correo electrónico sobre los próximos eventos de mantenimiento para ayudarte a planificar cualquier posible interrupción. Las suscripciones a las notificaciones de mantenimiento se administran a través de la página Comunicación de la consola de Google Cloud :

Ir a la página Comunicación

Una vez que te suscribas, se enviarán las siguientes notificaciones:

  • Notificación anticipada: Se envía entre 7 y 14 días antes de un evento de mantenimiento programado o después de que el cliente reprograma un evento de mantenimiento.
  • Canceled: Se envía si Google cancela un evento de mantenimiento programado o si el cliente lo reprograma.
  • En curso: Se envía cuando comienza un evento de mantenimiento.
  • Completado: Se envía cuando se completa un evento de mantenimiento.

También puedes ver los próximos programas de mantenimiento en la página de detalles de la instancia en la Google Cloud consola o usar Cloud Logging para ver los registros de mantenimiento.

Configura un período de mantenimiento

Un período de mantenimiento requiere un día de la semana y una hora de inicio en UTC para el período de una hora.

Consola de Google Cloud

Para configurar un período de mantenimiento cuando crees una instancia, consulta Crea una instancia.

gcloud

Crea una instancia con un período de mantenimiento especificando la marca --maintenance-policy-weekly-windows:

gcloud lustre instances create INSTANCE_ID \
  --location=LOCATION \
  --network=NETWORK_NAME \
  --filesystem=FS_NAME \
  --capacity-gib=CAPACITY \
  --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.
  • NETWORK_NAME: Es el nombre de la red de tu instancia.
  • FS_NAME: Es el nombre de tu sistema de archivos.
  • CAPACITY: Es la capacidad de tu instancia en GiB.
  • DAY: Día de la semana del período de mantenimiento (p.ej., TUESDAY).
  • START_TIME: Es la hora de inicio en UTC del período de mantenimiento en formato de diccionario (p.ej., {hours=1,minutes=0}).

API de REST

Para especificar un período de mantenimiento para una instancia, incluye el objeto maintenancePolicy cuando crees una instancia.

A continuación, se muestra un ejemplo de un objeto maintenancePolicy:

"maintenancePolicy": {
  "weeklyMaintenanceWindows": [
    {
      "dayOfWeek": "DAY",
      "startTime": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

Reemplaza lo siguiente:

  • DAY: Día de la semana para el período de mantenimiento (p.ej., TUESDAY).
  • HOURS: Hora del día para la hora de inicio del período de mantenimiento (p.ej., 1).
  • MINUTES: Es el minuto de la hora de inicio del período de mantenimiento (p.ej., 0).

Configura una ventana de exclusión

Para evitar que se realice el mantenimiento durante ciertos períodos, como festividades o eventos comerciales, puedes definir un período de exclusión de mantenimiento en tu política de mantenimiento. Las ventanas de exclusión pueden durar hasta dos semanas. Para crear un período de exclusión recurrente anual, no especifiques un año en las fechas de inicio y finalización.

Puedes combinar un período de mantenimiento semanal y una ventana de exclusión en la misma política.

Consola de Google Cloud

Para configurar una ventana de exclusión cuando crees una instancia, consulta Crea una instancia.

gcloud

Crea una instancia con un período de exclusión especificando la marca --maintenance-policy-exclusion-window:

gcloud lustre instances create INSTANCE_ID \
  --location=LOCATION \
  --network=NETWORK_NAME \
  --filesystem=FS_NAME \
  --capacity-gib=CAPACITY \
  --maintenance-policy-exclusion-window='startDate=START_DATE,endDate=END_DATE,time={TIME}'

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.
  • NETWORK_NAME: Es el nombre de la red de tu instancia.
  • FS_NAME: Es el nombre de tu sistema de archivos.
  • CAPACITY: Es la capacidad de tu instancia en GiB.
  • START_DATE: Es la fecha de inicio del período de exclusión de mantenimiento en formato YYYY-MM-DD. Para que se repita anualmente, usa el formato MM-DD.
  • END_DATE: Es la fecha de finalización del período de exclusión de mantenimiento en formato YYYY-MM-DD. Para que se repita anualmente, usa el formato MM-DD.
  • TIME: Es la hora de inicio y finalización en UTC del período de exclusión en formato de diccionario (p.ej., {hours=1,minutes=0}).

API de REST

A continuación, se muestra un ejemplo de un objeto maintenancePolicy con una ventana de exclusión:

"maintenancePolicy": {
  "maintenanceExclusionWindow": [
    {
      "startDate": {
        "year": START_YEAR,
        "month": START_MONTH,
        "day": START_DAY
      },
      "endDate": {
        "year": END_YEAR,
        "month": END_MONTH,
        "day": END_DAY
      },
      "time": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

Reemplaza lo siguiente:

  • START_YEAR: Año de la fecha de inicio del período de exclusión (p.ej., 2026). Omite este campo y END_YEAR para crear un período recurrente anual.
  • START_MONTH: Mes de la fecha de inicio del período de exclusión (p.ej., 12).
  • START_DAY: Día de la fecha de inicio del período de exclusión (p.ej., 24).
  • END_YEAR: Año de la fecha de finalización del período de exclusión (p.ej., 2027). Omite este campo y START_YEAR para crear un período recurrente anual.
  • END_MONTH: Es el mes de la fecha de finalización del período de exclusión (p.ej., 1).
  • END_DAY: Es el día de la fecha de finalización del período de exclusión (p.ej., 7).
  • HOURS: Hora del día para el período de exclusión (p.ej., 0).
  • MINUTES: Es el minuto de la hora para el horario del período de exclusión (p.ej., 0).

Actualiza una política de mantenimiento

Para agregar o modificar la política de mantenimiento de una instancia existente, haz lo siguiente:

Consola de Google Cloud

Para actualizar la política de mantenimiento de una instancia, consulta Administra instancias.

gcloud

En el siguiente ejemplo de gcloud, se actualiza la política de mantenimiento de una instancia:

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.
  • DAY: Día de la semana del período de mantenimiento (p.ej., TUESDAY).
  • START_TIME: Es la hora de inicio en UTC del período de mantenimiento en formato de diccionario (p.ej., {hours=1,minutes=0}).

API de REST

Para especificar un período de mantenimiento para una instancia, incluye el objeto maintenancePolicy cuando actualices una instancia. También debes especificar el maintenancePolicy en el parámetro de consulta updateMask.

En el siguiente ejemplo de curl, se actualiza la política de mantenimiento de una instancia:

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {
    "weeklyMaintenanceWindows": [
      {
        "dayOfWeek": "DAY",
        "startTime": {
          "hours": HOURS,
          "minutes": MINUTES
        }
      }
    ]
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
  • LOCATION Es la ubicación de la instancia de Managed Lustre.
  • INSTANCE_ID Es el ID de la instancia de Managed Lustre.
  • DAY: Día de la semana del período de mantenimiento (p.ej., TUESDAY).
  • HOURS La hora del día para la hora de inicio del período de mantenimiento (p.ej., 3).
  • MINUTES El minuto de la hora para la hora de inicio del período de mantenimiento (p.ej., 45).

Quita una política de mantenimiento

Para quitar una política de mantenimiento de una instancia, borra todos los períodos de mantenimiento semanales y los períodos de exclusión de la política.

Consola de Google Cloud

Para quitar una política de mantenimiento de una instancia, edita la instancia y borra los campos de la política de mantenimiento. Consulta Administra instancias.

gcloud

Usa el comando gcloud lustre instances update con las marcas --clear-maintenance-policy-weekly-windows y --clear-maintenance-policy-exclusion-window:

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--clear-maintenance-policy-weekly-windows \
--clear-maintenance-policy-exclusion-window

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.

API de REST

Para quitar una política de mantenimiento con la API de REST, usa el método instances.patch con un objeto maintenancePolicy vacío y el parámetro de consulta updateMask establecido en maintenancePolicy:

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
  • LOCATION: Es la ubicación de la instancia de Managed Lustre.
  • INSTANCE_ID: Es el ID de la instancia de Managed Lustre.

Consulta los registros de mantenimiento

Managed Lustre usa Cloud Logging para registrar eventos de mantenimiento, incluidos los siguientes tipos de actividad:

  • LustreAdvancedNotification: Se programó el mantenimiento de la instancia.
  • LustreOngoingNotification: Se inició el mantenimiento en la instancia. Una vez que se complete, se registrará otro evento LustreOngoingNotification, esta vez con is_completed=true.
  • LustreCancelledNotification: Se canceló el mantenimiento.

Puedes ver los registros de mantenimiento con el Explorador de registros o con Google Cloud CLI.

Explorador de registros

Para ver los registros de mantenimiento de Managed Lustre con el Explorador de registros, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Cloud Logging > Explorador de registros:

    Ve al Explorador de registros

  2. Ingresa el siguiente filtro en el editor de consultas y haz clic en Ejecutar consulta:

    resource.type="lustre.googleapis.com/Instance"
    resource.labels.instance_id="INSTANCE_ID"
    resource.labels.location="LOCATION"
    logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"
    

gcloud CLI

Para ver los registros de mantenimiento con Google Cloud CLI, ejecuta el comando gcloud logging read:

gcloud logging read 'resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"' --project=PROJECT_ID

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de la instancia de Managed Lustre.
  • LOCATION: La zona en la que se encuentra la instancia.
  • PROJECT_ID: Es el ID del proyecto en el que se encuentra la instancia.

Reprogramar mantenimiento

Si un evento de mantenimiento programado no se ajusta a tus necesidades, puedes reprogramarlo. Cuando lo hagas, tendrás las siguientes opciones:

  • De inmediato: Reprograma el evento de mantenimiento para que comience lo antes posible. Esta opción ignora los períodos de mantenimiento y los períodos de exclusión configurados en la instancia.
  • Siguiente período disponible: Reprograma el evento de mantenimiento para el siguiente período de mantenimiento disponible. Por lo general, esto desplaza la actualización una semana.
  • Por fecha: Reprograma el evento de mantenimiento para una fecha y hora específicas. Puedes retrasar el mantenimiento hasta un máximo de 28 días a partir de la hora programada originalmente. Esta opción ignora los períodos de mantenimiento y los períodos de exclusión configurados en la instancia.

Para reprogramar el mantenimiento, sigue estos pasos:

gcloud

Para iniciar el evento de mantenimiento lo antes posible, haz lo siguiente:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=immediately

Para reprogramar el mantenimiento al siguiente período disponible, haz lo siguiente:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=next-available-window

Para reprogramar el mantenimiento a una hora específica, sigue estos pasos:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=by-time \
--reschedule-schedule-time=TIMESTAMP

Reemplaza lo siguiente:

  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.
  • TIMESTAMP: Es la hora de inicio en formato RFC 3339 (por ejemplo, 2026-04-30T10:00:00Z). No debe ser posterior a 28 días de la hora programada originalmente.

API de REST

Usa el método instances.rescheduleMaintenance.

En el siguiente ejemplo de curl, se inicia el evento de mantenimiento lo antes posible:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "IMMEDIATELY"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

En el siguiente ejemplo de curl, se reprograma el mantenimiento para el siguiente período disponible:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "NEXT_AVAILABLE_WINDOW"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

En el siguiente ejemplo de curl, se reprograma el mantenimiento para una hora específica:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "BY_TIME",
    "scheduleTime": "TIMESTAMP"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
  • INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
  • LOCATION: Es la ubicación de tu instancia de Managed Lustre.
  • TIMESTAMP: Es la hora de inicio en formato RFC 3339 (por ejemplo, 2026-04-30T10:00:00Z). No debe ser posterior a 28 días de la hora programada originalmente.