Utilizzare le prenotazioni con le istanze di Agent Platform Workbench
Questo documento spiega come utilizzare le prenotazioni di Compute Engine per avere un'elevata garanzia che le istanze di Agent Platform Workbench di Gemini Enterprise dispongano di risorse di macchine virtuali (VM) sufficienti per l'esecuzione.
Le prenotazioni sono una funzionalità di Compute Engine. Ti aiutano ad avere sempre a disposizione le risorse necessarie per creare VM con lo stesso hardware (memoria e vCPU) e le stesse risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.
Quando crei una prenotazione, Compute Engine verifica che la capacità richiesta sia disponibile nella zona specificata. In caso affermativo, Compute Engine prenota le risorse, crea la prenotazione e si verifica quanto segue:
Le risorse prenotate sono immediatamente disponibili per l'utilizzo e rimangono disponibili fino all'eliminazione della prenotazione.
Le risorse prenotate ti vengono addebitate alla stessa tariffa on demand delle VM in esecuzione, inclusi eventuali sconti applicabili, fino all'eliminazione della prenotazione. Quando utilizzi una prenotazione, una VM non comporta addebiti duplicati per le risorse, poiché la prenotazione è già fatturata per il costo delle risorse prenotate. Per saperne di più, consulta Prenotazioni di risorse di zona di Compute Engine .
Limitazioni e requisiti
Quando le istanze di Agent Platform Workbench utilizzano le prenotazioni, si applicano tutte le limitazioni delle prenotazioni di Compute Engine. Consulta Come funzionano le prenotazioni work.
Inoltre, quando utilizzi le prenotazioni con le istanze di Agent Platform Workbench, si applicano le seguenti limitazioni e i seguenti requisiti:
La prenotazione deve essere una delle seguenti:
- Nello stesso progetto dell'istanza di Agent Platform Workbench.
- Condivisa con lo stesso progetto dell'istanza di Agent Platform Workbench.
Per utilizzare la prenotazione, le proprietà della VM di una prenotazione devono corrispondere esattamente all'istanza di Agent Platform Workbench. Ad esempio, se una prenotazione specifica un tipo di macchina
e2-standard-8, l'istanza di Agent Platform Workbench può utilizzare la prenotazione solo se utilizza anche un tipo di macchinae2-standard-8. Consulta Requisiti.
Prima di iniziare
- Esamina i requisiti e le limitazioni per le prenotazioni.
- Esamina i requisiti relativi alle quote e le limitazioni per le prenotazioni condivise.
- Accedi al tuo Google Cloud account. Se non hai mai utilizzato Google Cloud, crea un account per valutare il rendimento dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per eseguire, testare ed eseguire il deployment dei carichi di lavoro.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per utilizzare le prenotazioni con le istanze di Agent Platform Workbench, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:
- Amministratore Compute (
roles/compute.admin) - Amministratore notebook (
roles/notebooks.admin)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea una prenotazione
Crea una prenotazione di Compute Engine. Può essere una prenotazione per un singolo progetto o una prenotazione condivisa. La prenotazione può essere on demand o una prenotazione futura. Per saperne di più, consulta Scegliere un tipo di prenotazione.
Utilizzare una prenotazione con una nuova istanza
Per creare un'istanza di Agent Platform Workbench che utilizza una prenotazione, puoi utilizzare la Google Cloud console o l'API REST.
Console
Per creare un'istanza di Agent Platform Workbench che utilizza una prenotazione:
Nella Google Cloud console, vai alla pagina Istanze.
Fai clic su Crea nuova.
Nella finestra di dialogo Nuova istanza, fai clic su Opzioni avanzate.
Nella finestra di dialogo Crea istanza, nella sezione Tipo di macchina , seleziona il tipo di macchina e la configurazione GPU che corrispondono alla prenotazione.
In Piattaforma CPU e GPU, nel menu Prenotazioni, seleziona la prenotazione da utilizzare.
Fai clic su Crea.
Agent Platform Workbench crea un'istanza e la avvia automaticamente. Quando l'istanza è pronta per l'uso, Agent Platform Workbench attiva un link Apri JupyterLab.
REST
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
PROJECT_ID: il tuo ID progettoLOCATION: la zona in cui si trova l'istanzaINSTANCE_NAME: il nome dell'istanzaMACHINE_TYPE: il tipo di macchina dell'istanzaRESERVATION_TYPE: il tipo di prenotazione; deve essereRESERVATION_ANYoRESERVATION_SPECIFICRESERVATION_NAME: il nome della prenotazione quando utilizzi ilRESERVATION_SPECIFICtipo- Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
- Per le prenotazioni in un progetto diverso, devi utilizzare il percorso completo della prenotazione. Ad
esempio:
projects/PROJECT_ID/reservations/RESERVATION_NAME.
Metodo HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON della richiesta:
{
"gce_setup": {
"machine_type": "MACHINE_TYPE",
"reservation_affinity": {
"consume_reservation_type": "RESERVATION_TYPE",
"key": "compute.googleapis.com/reservation-name",
"values": ["RESERVATION_NAME"]
}
}
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salva il corpo della richiesta in un file denominato request.json,
e quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Per saperne di più, consulta la projects.locations.instances.create documentazione
dell'API REST.
Interrompere l'utilizzo della prenotazione
Per interrompere l'utilizzo della prenotazione, puoi eliminare la prenotazione.
Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che l'istanza di Agent Platform Workbench esistente la utilizzi, devi eliminare l'istanza.
Fatturazione
Quando utilizzi una prenotazione di Compute Engine, ti vengono addebitati i seguenti costi:
Le risorse di Compute Engine, inclusi eventuali sconti per impegno di utilizzo (CUD) applicabili, ai prezzi di Compute Engine. Questi addebiti hanno l'etichetta
goog-vertex-ai-product: workbench-instancesnello SKU. Consulta i prezzi di Compute Engine.Le tariffe di gestione di Agent Platform Workbench oltre all'utilizzo dell'infrastruttura. Consulta i prezzi di Agent Platform Workbench.
Risoluzione dei problemi
Per trovare metodi per diagnosticare e risolvere gli errori relativi all'utilizzo delle prenotazioni con le istanze di Agent Platform Workbench, consulta Risoluzione dei problemi relativi alle istanze di Agent Platform Workbench.
Passaggi successivi
- Per saperne di più sulle prenotazioni di Compute Engine, consulta Prenotazioni di risorse di zona di Compute Engine.