Descripción general de los modelos desplegados automáticamente

Model Garden te permite desplegar y servir modelos abiertos, de partners y personalizados en Vertex AI. A diferencia de las ofertas de modelo como servicio (MaaS), que no tienen servidor y no requieren un despliegue manual, los modelos autodesplegados se ejecutan de forma segura en tu proyecto Google Cloud y en tu red de VPC, lo que te da un control total sobre el entorno de despliegue.

Desplegar modelos abiertos por tu cuenta

Los modelos abiertos proporcionan funciones preentrenadas para varias tareas de IA, incluidos los modelos de Gemini, que destacan en el procesamiento multimodal. Estos modelos se pueden usar libremente y puedes publicar sus resultados siempre que cumplas sus términos de licencia. Vertex AI ofrece modelos de código abierto y de peso abierto.

Cuando usas un modelo abierto con Vertex AI, usas Vertex AI para tu infraestructura. También puedes usar modelos abiertos con otros productos de infraestructura, como PyTorch o Jax.

Modelos de peso abierto

Muchos modelos abiertos se consideran modelos de lenguaje extensos (LLMs) de peso abierto. Los modelos de peso abierto ofrecen más transparencia que los modelos que no son de peso abierto. Los pesos de un modelo son los valores numéricos almacenados en la arquitectura de la red neuronal del modelo que representan los patrones y las relaciones aprendidos a partir de los datos con los que se entrena el modelo. Se publican los parámetros o pesos preentrenados de los modelos de peso abierto. Puedes usar un modelo de pesos abiertos para la inferencia y la optimización. No siempre se proporcionan detalles como el conjunto de datos original, la arquitectura del modelo y el código de entrenamiento.

Modelos de software libre

Los modelos abiertos son diferentes de los modelos de IA de código abierto. Aunque los modelos abiertos suelen exponer los pesos y la representación numérica principal de los patrones aprendidos, no necesariamente proporcionan el código fuente completo ni los detalles del entrenamiento. Por otro lado, los modelos de código abierto suelen poner a disposición del público toda la base de código, incluidos los scripts y los datos de entrenamiento. Al proporcionar pesos, se ofrece un nivel de transparencia del modelo de IA que te permite comprender las funciones del modelo sin tener que crearlo tú mismo.

Modelos de partners con despliegue automático

Model Garden te ayuda a comprar y gestionar licencias de modelos de partners que ofrecen modelos propios como opción de autodespliegue. Puedes acceder a estos modelos a través de Cloud Marketplace. Una vez que tengas una licencia, puedes elegir entre desplegarla en hardware bajo demanda o usar tus reservas de Compute Engine y descuentos por uso continuado para gestionar los costes. Con los modelos de partners autodesplegados, se te factura tanto por el uso del modelo como por la infraestructura subyacente de Vertex AI consumida.

Para solicitar el uso de un modelo de partner autodesplegado, sigue estos pasos:

  1. Ve a la consola Model Garden.
  2. Busca el modelo de partner correspondiente.
  3. Haz clic en Habilitar y rellena el formulario proporcionado para obtener las licencias de uso comercial necesarias.

Para obtener más información sobre cómo implementar y usar modelos de partners, consulta Implementar un modelo de partner y enviar solicitudes de predicción.

Cuestiones importantes

Cuando utilices modelos de partners autodesplegados, ten en cuenta lo siguiente:

  • Exportación de pesos: a diferencia de lo que ocurre con algunos modelos abiertos, no puedes exportar los pesos de los modelos de partners implementados por ellos mismos.
  • Tipo de endpoint: solo se admite el tipo endpoint público compartido en estas implementaciones.

Más información sobre los modelos implementados automáticamente en Vertex AI