Usa reservas con instancias de Agent Platform Workbench
En este documento, se explica cómo usar las reservas de Compute Engine para garantizar que tus instancias de Agent Platform Workbench de Gemini Enterprise tengan suficientes recursos de máquina virtual (VM) para ejecutarse.
Las reservas son una función de Compute Engine. Ayudan a garantizar que tengas los recursos disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y los recursos opcionales (GPU y discos SSD locales) cuando los necesites.
Cuando creas una reserva, Compute Engine verifica que la capacidad solicitada esté disponible en la zona especificada. Si es así, Compute Engine reserva los recursos, crea la reserva y sucede lo siguiente:
Los recursos reservados están disponibles de inmediato para que los consumas y permanecen disponibles hasta que borres la reserva.
Se te cobra por los recursos reservados con la misma tarifa según demanda que las VMs en ejecución, incluidos los descuentos aplicables, hasta que se borre la reserva. Mientras consumes una reserva, una VM no genera cargos duplicados por los recursos, ya que la reserva ya se factura por el costo de los recursos reservados. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.
Limitaciones y requisitos
Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Agent Platform Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.
Además, cuando se usan reservas con instancias de Agent Platform Workbench, se aplican las siguientes limitaciones y requisitos:
Tu reserva debe ser una de las siguientes:
- En el mismo proyecto que tu instancia de Agent Platform Workbench
- Compartida con el mismo proyecto que tu instancia de Agent Platform Workbench
Las propiedades de la VM de una reserva deben coincidir exactamente con tu instancia de Agent Platform Workbench para consumir la reserva. Por ejemplo, si una reserva especifica un tipo de máquina
e2-standard-8, la instancia de Agent Platform Workbench solo puede consumir la reserva si también usa un tipo de máquinae2-standard-8. Consulta Requisitos.
Antes de comenzar
- Revisa los requisitos y las y las restricciones para las reservas.
- Revisa los requisitos de cuota y las restricciones para las reservas.
- Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Roles obligatorios
Para obtener los permisos que necesitas para usar reservas con instancias de Agent Platform Workbench, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:
- Administrador de Compute (
roles/compute.admin) - Administrador de notebooks (
roles/notebooks.admin)
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea una reserva
Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. La reserva puede ser según demanda o una reserva futura. Para obtener más información, consulta Elige un tipo de reserva.
Usa una reserva con una instancia nueva
Para crear una instancia de Agent Platform Workbench que consuma una reserva, puedes usar la Google Cloud console o la API de REST.
Console
Para crear una instancia de Agent Platform Workbench que consuma una reserva, haz lo siguiente:
En la Google Cloud console, ve a la página Instancias.
Haz clic en Crear nuevo.
En el cuadro de diálogo Instancia nueva, haz clic en Opciones avanzadas.
En el cuadro de diálogo Crear instancia, en la sección Tipo de máquina , selecciona el tipo de máquina y la configuración de GPU que coincidan con tu reserva.
En Plataforma de CPU y GPU, en el menú Reservas, selecciona la reserva que deseas consumir.
Haz clic en Crear.
Agent Platform Workbench crea una instancia y la inicia de forma automática. Cuando la instancia está lista para usarse, Agent Platform Workbench activa un vínculo Abrir JupyterLab.
REST
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
PROJECT_ID: el ID de tu proyectoLOCATION: La zona en la que se encuentra la instancia.INSTANCE_NAME: el nombre de tu instanciaMACHINE_TYPE: el tipo de máquina de la instanciaRESERVATION_TYPE: el tipo de reserva; debe serRESERVATION_ANYoRESERVATION_SPECIFICRESERVATION_NAME: el nombre de tu reserva cuando usas el tipoRESERVATION_SPECIFIC- Para las reservas en el mismo proyecto, puedes usar el ID de la reserva.
- Para las reservas en un proyecto diferente, debes usar la ruta de acceso completa de la reserva. Por
ejemplo:
projects/PROJECT_ID/reservations/RESERVATION_NAME.
Método HTTP y URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Cuerpo JSON de la solicitud:
{
"gce_setup": {
"machine_type": "MACHINE_TYPE",
"reservation_affinity": {
"consume_reservation_type": "RESERVATION_TYPE",
"key": "compute.googleapis.com/reservation-name",
"values": ["RESERVATION_NAME"]
}
}
}
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Para obtener más información, consulta la projects.locations.instances.createdocumentación
de la API de REST.
Deja de usar tu reserva
Para dejar de usar tu reserva, puedes borrarla.
Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Agent Platform Workbench la use, debes borrar la instancia.
Facturación
Cuando consumes una reserva de Compute Engine, se te factura lo siguiente:
Los recursos de Compute Engine, incluidos los descuentos por uso comprometido (CUD) aplicables, a los precios de Compute Engine. Estos cargos tienen la etiqueta
goog-vertex-ai-product: workbench-instancesen la SKU. Consulta los precios de Compute Engine.Tarifas de administración de Agent Platform Workbench, además del uso de tu infraestructura. Consulta los precios de Agent Platform Workbench.
Solucionar problemas
Para encontrar métodos para diagnosticar y resolver errores relacionados con el uso de reservas con instancias de Agent Platform Workbench, consulta Solución de problemas de instancias de Agent Platform Workbench.
¿Qué sigue?
- Para obtener más información sobre las reservas de Compute Engine, consulta Reservas de recursos zonales de Compute Engine.