Usa reservas con instancias de Agent Platform Workbench

En este documento, se explica cómo usar las reservas de Compute Engine para garantizar que tus instancias de Agent Platform Workbench de Gemini Enterprise tengan suficientes recursos de máquina virtual (VM) para ejecutarse.

Las reservas son una función de Compute Engine. Ayudan a garantizar que tengas los recursos disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y los recursos opcionales (GPU y discos SSD locales) cuando los necesites.

Cuando creas una reserva, Compute Engine verifica que la capacidad solicitada esté disponible en la zona especificada. Si es así, Compute Engine reserva los recursos, crea la reserva y sucede lo siguiente:

  • Los recursos reservados están disponibles de inmediato para que los consumas y permanecen disponibles hasta que borres la reserva.

  • Se te cobra por los recursos reservados con la misma tarifa según demanda que las VMs en ejecución, incluidos los descuentos aplicables, hasta que se borre la reserva. Mientras consumes una reserva, una VM no genera cargos duplicados por los recursos, ya que la reserva ya se factura por el costo de los recursos reservados. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.

Limitaciones y requisitos

Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Agent Platform Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.

Además, cuando se usan reservas con instancias de Agent Platform Workbench, se aplican las siguientes limitaciones y requisitos:

  • Tu reserva debe ser una de las siguientes:

    • En el mismo proyecto que tu instancia de Agent Platform Workbench
    • Compartida con el mismo proyecto que tu instancia de Agent Platform Workbench
  • Las propiedades de la VM de una reserva deben coincidir exactamente con tu instancia de Agent Platform Workbench para consumir la reserva. Por ejemplo, si una reserva especifica un tipo de máquina e2-standard-8, la instancia de Agent Platform Workbench solo puede consumir la reserva si también usa un tipo de máquina e2-standard-8. Consulta Requisitos.

Antes de comenzar

  1. Revisa los requisitos y las y las restricciones para las reservas.
  2. Revisa los requisitos de cuota y las restricciones para las reservas.
  3. Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Roles obligatorios

Para obtener los permisos que necesitas para usar reservas con instancias de Agent Platform Workbench, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Crea una reserva

Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. La reserva puede ser según demanda o una reserva futura. Para obtener más información, consulta Elige un tipo de reserva.

Usa una reserva con una instancia nueva

Para crear una instancia de Agent Platform Workbench que consuma una reserva, puedes usar la Google Cloud console o la API de REST.

Console

Para crear una instancia de Agent Platform Workbench que consuma una reserva, haz lo siguiente:

  1. En la Google Cloud console, ve a la página Instancias.

    Ir a Instancias

  2. Haz clic en  Crear nuevo.

  3. En el cuadro de diálogo Instancia nueva, haz clic en Opciones avanzadas.

  4. En el cuadro de diálogo Crear instancia, en la sección Tipo de máquina , selecciona el tipo de máquina y la configuración de GPU que coincidan con tu reserva.

  5. En Plataforma de CPU y GPU, en el menú Reservas, selecciona la reserva que deseas consumir.

  6. Haz clic en Crear.

    Agent Platform Workbench crea una instancia y la inicia de forma automática. Cuando la instancia está lista para usarse, Agent Platform Workbench activa un vínculo Abrir JupyterLab.

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • PROJECT_ID: el ID de tu proyecto
  • LOCATION: La zona en la que se encuentra la instancia.
  • INSTANCE_NAME: el nombre de tu instancia
  • MACHINE_TYPE: el tipo de máquina de la instancia
  • RESERVATION_TYPE: el tipo de reserva; debe ser RESERVATION_ANY o RESERVATION_SPECIFIC
  • RESERVATION_NAME: el nombre de tu reserva cuando usas el tipo RESERVATION_SPECIFIC
    • Para las reservas en el mismo proyecto, puedes usar el ID de la reserva.
    • Para las reservas en un proyecto diferente, debes usar la ruta de acceso completa de la reserva. Por ejemplo: projects/PROJECT_ID/reservations/RESERVATION_NAME.

Método HTTP y URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Cuerpo JSON de la solicitud:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Si se ejecuta correctamente, el cuerpo de la respuesta contiene una instancia de operación.

Para obtener más información, consulta la projects.locations.instances.createdocumentación de la API de REST.

Deja de usar tu reserva

Para dejar de usar tu reserva, puedes borrarla.

Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Agent Platform Workbench la use, debes borrar la instancia.

Facturación

Cuando consumes una reserva de Compute Engine, se te factura lo siguiente:

  • Los recursos de Compute Engine, incluidos los descuentos por uso comprometido (CUD) aplicables, a los precios de Compute Engine. Estos cargos tienen la etiqueta goog-vertex-ai-product: workbench-instances en la SKU. Consulta los precios de Compute Engine.

  • Tarifas de administración de Agent Platform Workbench, además del uso de tu infraestructura. Consulta los precios de Agent Platform Workbench.

Solucionar problemas

Para encontrar métodos para diagnosticar y resolver errores relacionados con el uso de reservas con instancias de Agent Platform Workbench, consulta Solución de problemas de instancias de Agent Platform Workbench.

¿Qué sigue?