Model Garden te permite autoimplementar modelos de socios seleccionados (vista previa). Los modelos implementados por el usuario no son sin servidores. Debes implementarlos en Vertex AI antes de usarlos. Estos modelos se implementan de forma segura en tu proyecto y red de VPC deGoogle Cloud . Para obtener más información sobre los modelos implementados por el usuario, consulta la documentación sobre los modelos implementados por el usuario.
Compra modelos de socios con autoimplementación
Para implementar modelos de socios autoinstalarles en Vertex AI, primero debes comprarlos a través de Google Cloud Marketplace. Para comprar un modelo de socio implementado por el usuario, haz lo siguiente:
Ve a Model Garden.
En Colecciones de modelos, haz clic en Modelos de socios con autoimplementación para filtrar la lista de modelos.
Haz clic en la tarjeta del modelo de socio que deseas comprar.
Haz clic en Comunícate con Ventas.
Completa el formulario y envía tu solicitud.
Después de completar estos pasos, te conectarás con un representante de ventas de Google Cloud para finalizar la compra.
Implementar modelos
Después de comprar un modelo de socio autoincluido, puedes implementarlo en un extremo de Vertex AI con la implementación con un clic. Este proceso simplifica la implementación, ya que preconfigura los parámetros necesarios.
Puedes realizar la implementación con un solo clic usando la Google Cloud consola o el SDK de Vertex AI para Python.
Console
Para implementar un modelo de socio en la consola de Google Cloud , haz lo siguiente:
Ve a Model Garden.
Busca y haz clic en la tarjeta del modelo de socio que deseas usar.
Haz clic en Implementar modelo.
Configura los parámetros de implementación según se te indique.
Haz clic en Implementar.
Python
En el siguiente ejemplo, se muestra cómo implementar un modelo de socio con el SDK de Vertex AI para Python. Reemplaza los valores de marcador de posición por tu información específica.
import vertexai
from vertexai import model_garden
vertexai.init(project="PROJECT_ID", location="LOCATION")
# Replace with the actual partner model ID from Model Garden
model = model_garden.OpenModel("PARTNER_MODEL_ID")
endpoint = model.deploy(
accept_eula=True,
machine_type="MACHINE_TYPE", # e.g., "a3-ultragpu-8g"
accelerator_type="ACCELERATOR_TYPE", # e.g., "NVIDIA_H200_141GB"
accelerator_count=ACCELERATOR_COUNT, # e.g., 8
serving_container_image_uri="SERVING_CONTAINER_IMAGE_URI",
endpoint_display_name="ENDPOINT_DISPLAY_NAME",
model_display_name="MODEL_DISPLAY_NAME",
use_dedicated_endpoint=True,
)
print(f"Model deployed to endpoint: {endpoint.resource_name}")
¿Qué sigue?
- Elige una opción de servicio de modelos abiertos
- Usa modelos abiertos con el modelo como servicio (MaaS)
- Implementa modelos abiertos con contenedores compilados previamente
- Implementa modelos abiertos con un contenedor de vLLM personalizado