Utilizzare le prenotazioni con le istanze di Agent Platform Workbench

Questo documento spiega come utilizzare le prenotazioni di Compute Engine per avere un'elevata garanzia che le istanze di Agent Platform Workbench di Gemini Enterprise dispongano di risorse di macchine virtuali (VM) sufficienti per l'esecuzione.

Le prenotazioni sono una funzionalità di Compute Engine. Ti aiutano ad avere sempre a disposizione le risorse necessarie per creare VM con lo stesso hardware (memoria e vCPU) e le stesse risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.

Quando crei una prenotazione, Compute Engine verifica che la capacità richiesta sia disponibile nella zona specificata. In caso affermativo, Compute Engine prenota le risorse, crea la prenotazione e si verifica quanto segue:

  • Le risorse prenotate sono immediatamente disponibili per l'utilizzo e rimangono disponibili fino all'eliminazione della prenotazione.

  • Le risorse prenotate ti vengono addebitate alla stessa tariffa on demand delle VM in esecuzione, inclusi eventuali sconti applicabili, fino all'eliminazione della prenotazione. Quando utilizzi una prenotazione, una VM non comporta addebiti duplicati per le risorse, poiché la prenotazione è già fatturata per il costo delle risorse prenotate. Per saperne di più, consulta Prenotazioni di risorse di zona di Compute Engine .

Limitazioni e requisiti

Quando le istanze di Agent Platform Workbench utilizzano le prenotazioni, si applicano tutte le limitazioni delle prenotazioni di Compute Engine. Consulta Come funzionano le prenotazioni work.

Inoltre, quando utilizzi le prenotazioni con le istanze di Agent Platform Workbench, si applicano le seguenti limitazioni e i seguenti requisiti:

  • La prenotazione deve essere una delle seguenti:

    • Nello stesso progetto dell'istanza di Agent Platform Workbench.
    • Condivisa con lo stesso progetto dell'istanza di Agent Platform Workbench.
  • Per utilizzare la prenotazione, le proprietà della VM di una prenotazione devono corrispondere esattamente all'istanza di Agent Platform Workbench. Ad esempio, se una prenotazione specifica un tipo di macchina e2-standard-8, l'istanza di Agent Platform Workbench può utilizzare la prenotazione solo se utilizza anche un tipo di macchina e2-standard-8. Consulta Requisiti.

Prima di iniziare

  1. Esamina i requisiti e le limitazioni per le prenotazioni.
  2. Esamina i requisiti relativi alle quote e le limitazioni per le prenotazioni condivise.
  3. Accedi al tuo Google Cloud account. Se non hai mai utilizzato Google Cloud, crea un account per valutare il rendimento dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per eseguire, testare ed eseguire il deployment dei carichi di lavoro.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per utilizzare le prenotazioni con le istanze di Agent Platform Workbench, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Crea una prenotazione

Crea una prenotazione di Compute Engine. Può essere una prenotazione per un singolo progetto o una prenotazione condivisa. La prenotazione può essere on demand o una prenotazione futura. Per saperne di più, consulta Scegliere un tipo di prenotazione.

Utilizzare una prenotazione con una nuova istanza

Per creare un'istanza di Agent Platform Workbench che utilizza una prenotazione, puoi utilizzare la Google Cloud console o l'API REST.

Console

Per creare un'istanza di Agent Platform Workbench che utilizza una prenotazione:

  1. Nella Google Cloud console, vai alla pagina Istanze.

    Vai a Istanze

  2. Fai clic su  Crea nuova.

  3. Nella finestra di dialogo Nuova istanza, fai clic su Opzioni avanzate.

  4. Nella finestra di dialogo Crea istanza, nella sezione Tipo di macchina , seleziona il tipo di macchina e la configurazione GPU che corrispondono alla prenotazione.

  5. In Piattaforma CPU e GPU, nel menu Prenotazioni, seleziona la prenotazione da utilizzare.

  6. Fai clic su Crea.

    Agent Platform Workbench crea un'istanza e la avvia automaticamente. Quando l'istanza è pronta per l'uso, Agent Platform Workbench attiva un link Apri JupyterLab.

REST

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • PROJECT_ID: il tuo ID progetto
  • LOCATION: la zona in cui si trova l'istanza
  • INSTANCE_NAME: il nome dell'istanza
  • MACHINE_TYPE: il tipo di macchina dell'istanza
  • RESERVATION_TYPE: il tipo di prenotazione; deve essere RESERVATION_ANY o RESERVATION_SPECIFIC
  • RESERVATION_NAME: il nome della prenotazione quando utilizzi il RESERVATION_SPECIFIC tipo
    • Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
    • Per le prenotazioni in un progetto diverso, devi utilizzare il percorso completo della prenotazione. Ad esempio: projects/PROJECT_ID/reservations/RESERVATION_NAME.

Metodo HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON della richiesta:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, e quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
In caso di esito positivo, il corpo della risposta contiene un'istanza di Operation.

Per saperne di più, consulta la projects.locations.instances.create documentazione dell'API REST.

Interrompere l'utilizzo della prenotazione

Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.

Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che l'istanza di Agent Platform Workbench esistente la utilizzi, devi eliminare l'istanza.

Fatturazione

Quando utilizzi una prenotazione di Compute Engine, ti vengono addebitati i seguenti costi:

  • Le risorse di Compute Engine, inclusi eventuali sconti per impegno di utilizzo (CUD) applicabili, ai prezzi di Compute Engine. Questi addebiti hanno l'etichetta goog-vertex-ai-product: workbench-instances nello SKU. Consulta i prezzi di Compute Engine.

  • Le tariffe di gestione di Agent Platform Workbench oltre all'utilizzo dell'infrastruttura. Consulta i prezzi di Agent Platform Workbench.

Risoluzione dei problemi

Per trovare metodi per diagnosticare e risolvere gli errori relativi all'utilizzo delle prenotazioni con le istanze di Agent Platform Workbench, consulta Risoluzione dei problemi relativi alle istanze di Agent Platform Workbench.

Passaggi successivi