Model Garden te permite autoimplementar modelos de socios seleccionados (vista previa). Los modelos autoimplementados no son sin servidores. Debes implementarlos en Gemini Enterprise Agent Platform antes de usarlos. Estos modelos se implementan de forma segura en tu Google Cloud proyecto y red de VPC. Para obtener más información sobre los modelos autoimplementados, consulta la documentación de modelos autoimplementados.
Compra modelos de socios autoimplementables
Para implementar modelos de socios autoimplementables en Gemini Enterprise Agent Platform, primero debes comprarlos a través de Google Cloud Marketplace. Para comprar un modelo de socio autoimplementado, haz lo siguiente:
Ve a Model Garden.
En Colecciones de modelos, haz clic en Modelos de socios autoimplementables para filtrar la lista de modelos.
Haz clic en la ficha del modelo del modelo de socio que deseas comprar.
Haz clic en Comunicarse con ventas.
Completa el formulario y envía tu solicitud.
Después de completar estos pasos, te conectarás con un Google Cloud representante de ventas para finalizar la compra.
Implementar modelos
Después de comprar un modelo de socio autoimplementable, puedes implementarlo en un extremo de Gemini Enterprise Agent Platform con la implementación con un clic. Este proceso simplifica la implementación mediante la configuración previa de los parámetros necesarios.
Puedes realizar la implementación con un clic con la Google Cloud consola o el SDK de Agent Platform para Python.
Console
Para implementar un modelo de socio en la Google Cloud consola, haz lo siguiente:
Ve a Model Garden.
Busca y haz clic en la ficha del modelo del modelo de socio que deseas usar.
Haz clic en Implementar modelo.
Configura los parámetros de implementación según se te solicite.
Haz clic en Implementar.
Python
En el siguiente ejemplo, se muestra cómo implementar un modelo de socio con el SDK de Agent Platform para Python. Reemplaza los valores de marcador de posición por tu información específica.
import vertexai
from vertexai import model_garden
vertexai.init(project="PROJECT_ID", location="LOCATION")
# Replace with the actual partner model ID from Model Garden
model = model_garden.OpenModel("PARTNER_MODEL_ID")
endpoint = model.deploy(
accept_eula=True,
machine_type="MACHINE_TYPE", # e.g., "a3-ultragpu-8g"
accelerator_type="ACCELERATOR_TYPE", # e.g., "NVIDIA_H200_141GB"
accelerator_count=ACCELERATOR_COUNT, # e.g., 8
serving_container_image_uri="SERVING_CONTAINER_IMAGE_URI",
endpoint_display_name="ENDPOINT_DISPLAY_NAME",
model_display_name="MODEL_DISPLAY_NAME",
use_dedicated_endpoint=True,
)
print(f"Model deployed to endpoint: {endpoint.resource_name}")
¿Qué sigue?
- Elige una opción de entrega de modelos abiertos
- Usa modelos abiertos con Model as a Service (MaaS)
- Implementa modelos abiertos con contenedores compilados previamente
- Implementa modelos abiertos con un contenedor de vLLM personalizado