Para mantener actualizadas tus instancias de Google Cloud Managed Lustre, Google Cloudse realiza mantenimiento periódico en ellas. Los eventos de mantenimiento pueden incluir actualizaciones del software o la infraestructura subyacentes. Estos eventos pueden causar un tiempo de inactividad temporal, durante el cual es posible que las operaciones de E/S en la instancia dejen de responder. Las operaciones de E/S afectadas se reanudan una vez que se completa el mantenimiento. El tiempo de inactividad suele ser de entre 2 y 25 minutos.
Mientras el mantenimiento está en curso, el estado de una instancia es UPGRADING. Una vez que se completa el mantenimiento, la instancia vuelve al estado ACTIVE.
Las políticas de mantenimiento te permiten controlar cuándo ocurren estos eventos de mantenimiento. Puedes configurar una política de mantenimiento para cada instancia y especificar períodos de mantenimiento y períodos en los que se debe excluir el mantenimiento. Si no se configura ninguna política de mantenimiento en una instancia, el mantenimiento puede ocurrir en cualquier momento.
También puedes reprogramar un evento de mantenimiento para que comience de inmediato, durante el próximo período disponible o en un momento específico hasta 28 días después.
Instancias de escala extrema
Es posible que algunas configuraciones de Managed Lustre que proporcionan un rendimiento y una escala extremos requieran un tiempo de inactividad planificado de hasta 4 horas para el mantenimiento periódico del host. Google coordina estos eventos de mantenimiento contigo con anticipación.
Acerca de las políticas de mantenimiento
Puedes configurar una política de mantenimiento en cada instancia de Managed Lustre. Una política de mantenimiento incluye lo siguiente:
- Período de mantenimiento semanal: Es un período recurrente de una hora durante la semana en el que se permite que Managed Lustre inicie un evento de mantenimiento.
- Período de exclusión de mantenimiento: Es un período durante el cual Managed Lustre no puede iniciar un evento de mantenimiento. Puedes definir una ventana de exclusión por instancia, con una duración máxima de dos semanas. Si no se especifica ningún año en las fechas de inicio y finalización, el período de exclusión se repite anualmente.
Un período de exclusión tiene prioridad sobre un período de mantenimiento normal. Si un evento programado se produce durante este período, Lustre administrado aplaza el evento hasta el siguiente período disponible o lo omite por completo. La actualización se aplica durante el siguiente ciclo de mantenimiento.
Notificaciones de mantenimiento
Puedes suscribirte a las notificaciones por correo electrónico sobre los próximos eventos de mantenimiento para ayudarte a planificar cualquier posible interrupción. Las suscripciones a las notificaciones de mantenimiento se administran a través de la página Comunicación de la consola de Google Cloud :
Una vez que te suscribas, se enviarán las siguientes notificaciones:
- Notificación anticipada: Se envía entre 7 y 14 días antes de un evento de mantenimiento programado o después de que el cliente reprograma un evento de mantenimiento.
- Canceled: Se envía si Google cancela un evento de mantenimiento programado o si el cliente lo reprograma.
- En curso: Se envía cuando comienza un evento de mantenimiento.
- Completado: Se envía cuando se completa un evento de mantenimiento.
También puedes ver los próximos programas de mantenimiento en la página de detalles de la instancia en la Google Cloud consola o usar Cloud Logging para ver los registros de mantenimiento.
Configura un período de mantenimiento
Un período de mantenimiento requiere un día de la semana y una hora de inicio en UTC para el período de una hora.
Consola de Google Cloud
Para configurar un período de mantenimiento cuando crees una instancia, consulta Crea una instancia.
gcloud
Crea una instancia con un período de mantenimiento especificando la marca --maintenance-policy-weekly-windows:
gcloud lustre instances create INSTANCE_ID \ --location=LOCATION \ --network=NETWORK_NAME \ --filesystem=FS_NAME \ --capacity-gib=CAPACITY \ --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'
Reemplaza lo siguiente:
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
- NETWORK_NAME: Es el nombre de la red de tu instancia.
- FS_NAME: Es el nombre de tu sistema de archivos.
- CAPACITY: Es la capacidad de tu instancia en GiB.
- DAY: Día de la semana del período de mantenimiento (p.ej.,
TUESDAY). - START_TIME: Es la hora de inicio en UTC del período de mantenimiento en formato de diccionario (p.ej.,
{hours=1,minutes=0}).
API de REST
Para especificar un período de mantenimiento para una instancia, incluye el objeto maintenancePolicy cuando crees una instancia.
A continuación, se muestra un ejemplo de un objeto maintenancePolicy:
"maintenancePolicy": {
"weeklyMaintenanceWindows": [
{
"dayOfWeek": "DAY",
"startTime": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
Reemplaza lo siguiente:
- DAY: Día de la semana para el período de mantenimiento (p.ej.,
TUESDAY). - HOURS: Hora del día para la hora de inicio del período de mantenimiento (p.ej.,
1). - MINUTES: Es el minuto de la hora de inicio del período de mantenimiento (p.ej.,
0).
Configura una ventana de exclusión
Para evitar que se realice el mantenimiento durante ciertos períodos, como festividades o eventos comerciales, puedes definir un período de exclusión de mantenimiento en tu política de mantenimiento. Las ventanas de exclusión pueden durar hasta dos semanas. Para crear un período de exclusión recurrente anual, no especifiques un año en las fechas de inicio y finalización.
Puedes combinar un período de mantenimiento semanal y una ventana de exclusión en la misma política.
Consola de Google Cloud
Para configurar una ventana de exclusión cuando crees una instancia, consulta Crea una instancia.
gcloud
Crea una instancia con un período de exclusión especificando la marca --maintenance-policy-exclusion-window:
gcloud lustre instances create INSTANCE_ID \ --location=LOCATION \ --network=NETWORK_NAME \ --filesystem=FS_NAME \ --capacity-gib=CAPACITY \ --maintenance-policy-exclusion-window='startDate=START_DATE,endDate=END_DATE,time={TIME}'
Reemplaza lo siguiente:
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
- NETWORK_NAME: Es el nombre de la red de tu instancia.
- FS_NAME: Es el nombre de tu sistema de archivos.
- CAPACITY: Es la capacidad de tu instancia en GiB.
- START_DATE: Es la fecha de inicio del período de exclusión de mantenimiento en formato
YYYY-MM-DD. Para que se repita anualmente, usa el formatoMM-DD. - END_DATE: Es la fecha de finalización del período de exclusión de mantenimiento en formato
YYYY-MM-DD. Para que se repita anualmente, usa el formatoMM-DD. - TIME: Es la hora de inicio y finalización en UTC del período de exclusión en formato de diccionario (p.ej.,
{hours=1,minutes=0}).
API de REST
A continuación, se muestra un ejemplo de un objeto maintenancePolicy con una ventana de exclusión:
"maintenancePolicy": {
"maintenanceExclusionWindow": [
{
"startDate": {
"year": START_YEAR,
"month": START_MONTH,
"day": START_DAY
},
"endDate": {
"year": END_YEAR,
"month": END_MONTH,
"day": END_DAY
},
"time": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
Reemplaza lo siguiente:
- START_YEAR: Año de la fecha de inicio del período de exclusión (p.ej.,
2026). Omite este campo yEND_YEARpara crear un período recurrente anual. - START_MONTH: Mes de la fecha de inicio del período de exclusión (p.ej.,
12). - START_DAY: Día de la fecha de inicio del período de exclusión (p.ej.,
24). - END_YEAR: Año de la fecha de finalización del período de exclusión (p.ej.,
2027). Omite este campo ySTART_YEARpara crear un período recurrente anual. - END_MONTH: Es el mes de la fecha de finalización del período de exclusión (p.ej.,
1). - END_DAY: Es el día de la fecha de finalización del período de exclusión (p.ej.,
7). - HOURS: Hora del día para el período de exclusión (p.ej.,
0). - MINUTES: Es el minuto de la hora para el horario del período de exclusión (p.ej.,
0).
Actualiza una política de mantenimiento
Para agregar o modificar la política de mantenimiento de una instancia existente, haz lo siguiente:
Consola de Google Cloud
Para actualizar la política de mantenimiento de una instancia, consulta Administra instancias.
gcloud
En el siguiente ejemplo de gcloud, se actualiza la política de mantenimiento de una instancia:
gcloud lustre instances update INSTANCE_ID \ --location=LOCATION \ --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'
Reemplaza lo siguiente:
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
- DAY: Día de la semana del período de mantenimiento (p.ej.,
TUESDAY). - START_TIME: Es la hora de inicio en UTC del período de mantenimiento en formato de diccionario (p.ej.,
{hours=1,minutes=0}).
API de REST
Para especificar un período de mantenimiento para una instancia, incluye el objeto maintenancePolicy cuando actualices una instancia. También debes especificar el maintenancePolicy en el parámetro de consulta updateMask.
En el siguiente ejemplo de curl, se actualiza la política de mantenimiento de una instancia:
curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"maintenancePolicy": {
"weeklyMaintenanceWindows": [
{
"dayOfWeek": "DAY",
"startTime": {
"hours": HOURS,
"minutes": MINUTES
}
}
]
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"
Reemplaza lo siguiente:
- PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
- LOCATION Es la ubicación de la instancia de Managed Lustre.
- INSTANCE_ID Es el ID de la instancia de Managed Lustre.
- DAY: Día de la semana del período de mantenimiento (p.ej.,
TUESDAY). - HOURS La hora del día para la hora de inicio del período de mantenimiento (p.ej.,
3). - MINUTES El minuto de la hora para la hora de inicio del período de mantenimiento (p.ej.,
45).
Quita una política de mantenimiento
Para quitar una política de mantenimiento de una instancia, borra todos los períodos de mantenimiento semanales y los períodos de exclusión de la política.
Consola de Google Cloud
Para quitar una política de mantenimiento de una instancia, edita la instancia y borra los campos de la política de mantenimiento. Consulta Administra instancias.
gcloud
Usa el comando gcloud lustre instances update con las marcas --clear-maintenance-policy-weekly-windows y --clear-maintenance-policy-exclusion-window:
gcloud lustre instances update INSTANCE_ID \ --location=LOCATION \ --clear-maintenance-policy-weekly-windows \ --clear-maintenance-policy-exclusion-window
Reemplaza lo siguiente:
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
API de REST
Para quitar una política de mantenimiento con la API de REST, usa el método instances.patch con un objeto maintenancePolicy vacío y el parámetro de consulta updateMask establecido en maintenancePolicy:
curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"maintenancePolicy": {}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"
Reemplaza lo siguiente:
- PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
- LOCATION: Es la ubicación de la instancia de Managed Lustre.
- INSTANCE_ID: Es el ID de la instancia de Managed Lustre.
Consulta los registros de mantenimiento
Managed Lustre usa Cloud Logging para registrar eventos de mantenimiento, incluidos los siguientes tipos de actividad:
LustreAdvancedNotification: Se programó el mantenimiento de la instancia.LustreOngoingNotification: Se inició el mantenimiento en la instancia. Una vez que se complete, se registrará otro eventoLustreOngoingNotification, esta vez conis_completed=true.LustreCancelledNotification: Se canceló el mantenimiento.
Puedes ver los registros de mantenimiento con el Explorador de registros o con Google Cloud CLI.
Explorador de registros
Para ver los registros de mantenimiento de Managed Lustre con el Explorador de registros, haz lo siguiente:
En la consola de Google Cloud , ve a la página Cloud Logging > Explorador de registros:
Ingresa el siguiente filtro en el editor de consultas y haz clic en Ejecutar consulta:
resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"
gcloud CLI
Para ver los registros de mantenimiento con Google Cloud CLI, ejecuta el comando gcloud logging read:
gcloud logging read 'resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"' --project=PROJECT_ID
Reemplaza lo siguiente:
INSTANCE_ID: Es el ID de la instancia de Managed Lustre.LOCATION: La zona en la que se encuentra la instancia.PROJECT_ID: Es el ID del proyecto en el que se encuentra la instancia.
Reprogramar mantenimiento
Si un evento de mantenimiento programado no se ajusta a tus necesidades, puedes reprogramarlo. Cuando lo hagas, tendrás las siguientes opciones:
- De inmediato: Reprograma el evento de mantenimiento para que comience lo antes posible. Esta opción ignora los períodos de mantenimiento y los períodos de exclusión configurados en la instancia.
- Siguiente período disponible: Reprograma el evento de mantenimiento para el siguiente período de mantenimiento disponible. Por lo general, esto desplaza la actualización una semana.
- Por fecha: Reprograma el evento de mantenimiento para una fecha y hora específicas. Puedes retrasar el mantenimiento hasta un máximo de 28 días a partir de la hora programada originalmente. Esta opción ignora los períodos de mantenimiento y los períodos de exclusión configurados en la instancia.
Para reprogramar el mantenimiento, sigue estos pasos:
gcloud
Para iniciar el evento de mantenimiento lo antes posible, haz lo siguiente:
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=immediately
Para reprogramar el mantenimiento al siguiente período disponible, haz lo siguiente:
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=next-available-window
Para reprogramar el mantenimiento a una hora específica, sigue estos pasos:
gcloud lustre instances reschedule-maintenance INSTANCE_ID \ --location=LOCATION \ --reschedule-type=by-time \ --reschedule-schedule-time=TIMESTAMP
Reemplaza lo siguiente:
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
- TIMESTAMP: Es la hora de inicio en formato RFC 3339 (por ejemplo,
2026-04-30T10:00:00Z). No debe ser posterior a 28 días de la hora programada originalmente.
API de REST
Usa el
método
instances.rescheduleMaintenance.
En el siguiente ejemplo de curl, se inicia el evento de mantenimiento lo antes posible:
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "IMMEDIATELY"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
En el siguiente ejemplo de curl, se reprograma el mantenimiento para el siguiente período disponible:
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "NEXT_AVAILABLE_WINDOW"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
En el siguiente ejemplo de curl, se reprograma el mantenimiento para una hora específica:
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
"reschedule": {
"rescheduleType": "BY_TIME",
"scheduleTime": "TIMESTAMP"
}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"
Reemplaza lo siguiente:
- PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
- INSTANCE_ID: Es el ID de tu instancia de Managed Lustre.
- LOCATION: Es la ubicación de tu instancia de Managed Lustre.
- TIMESTAMP: Es la hora de inicio en formato RFC 3339 (por ejemplo,
2026-04-30T10:00:00Z). No debe ser posterior a 28 días de la hora programada originalmente.