Riavvia una risorsa permanente

Puoi riavviare qualsiasi risorsa permanente nello stato RUNNING o ERROR. Il riavvio di una risorsa permanente ti consente di recuperare gli errori che la risorsa permanente non può recuperare autonomamente. Puoi anche riavviare una risorsa permanente per ottenere manualmente cluster più aggiornati. Questa pagina mostra come riavviare una risorsa permanente utilizzando la Google Cloud console e l'API REST.

Ruoli obbligatori

Per ottenere l'autorizzazione necessaria per riavviare una risorsa permanente, chiedi all'amministratore di concederti il ruolo IAM Agent Platform Administrator (roles/aiplatform.admin) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene l' aiplatform.persistentResources.update autorizzazione, necessaria per riavviare una risorsa permanente.

Potresti anche ottenere questa autorizzazione con ruoli personalizzati o altri ruoli predefiniti.

Riavviare una risorsa permanente

Seleziona una delle seguenti schede per istruzioni su come riavviare una risorsa permanente. Assicurati che non siano in esecuzione job di addestramento sulla risorsa permanente.

Console

Per riavviare una risorsa permanente nella Google Cloud console:

  1. Nella Google Cloud console, vai alla pagina Risorse permanenti.

    Vai a Risorse permanenti

  2. Accanto al nome della risorsa permanente che vuoi riavviare, fai clic sui puntini di sospensione verticali ().

  3. Fai clic su Riavvia.

  4. Fai clic su Conferma.

gcloud

Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:

  • PROJECT_ID: l'ID progetto della risorsa permanente che vuoi riavviare.
  • LOCATION: la regione della risorsa permanente che vuoi riavviare.
  • PERSISTENT_RESOURCE_ID: l'ID della risorsa permanente che vuoi riavviare.

Esegui questo comando:

Linux, macOS o Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Dovresti ricevere una risposta simile alla seguente:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • PROJECT_ID: l'ID progetto della risorsa permanente che vuoi riavviare.
  • LOCATION: la regione della risorsa permanente che vuoi riavviare.
  • PERSISTENT_RESOURCE_ID: l'ID della risorsa permanente che vuoi riavviare.

Metodo HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

Il riavvio di una risorsa permanente è un' operazione a lunga esecuzione, durante la quale la risorsa permanente non può essere eliminata. L'operazione contiene un campo progressMessage che viene compilato con uno stato di errore, se si verifica. Dopo che l'operazione indica "done: true", controlla lo stato della risorsa permanente. Se la risorsa permanente è nello stato RUNNING, il riavvio è andato a buon fine ed è pronta per eseguire job di addestramento.

Limitazioni

Di seguito sono riportate le limitazioni per il riavvio di una risorsa permanente:

  • In alcuni casi, è possibile perdere la capacità delle risorse scarse durante il riavvio di una risorsa permanente. La conservazione completa delle risorse non è garantita.
  • Il riavvio non è disponibile su Ray on Vertex AI.
  • Le risorse permanenti che contengono pool di worker con scalabilità automatica vengono riavviate con il numero minimo di repliche.

Passaggi successivi