Descripción general de los modelos que se implementan por sí solos

Model Garden te permite implementar y entregar por tu cuenta modelos abiertos, de socios y personalizados en Vertex AI. A diferencia de las ofertas de modelo como servicio (MaaS), que no requieren implementación manual y no tienen servidores, los modelos implementados por el usuario se ejecutan de forma segura dentro de tu proyecto Google Cloud y tu red de VPC, lo que te brinda un control total sobre el entorno de implementación.

Implementa modelos abiertos por tu cuenta

Los modelos abiertos proporcionan capacidades previamente entrenadas para diversas tareas de IA, incluidos los modelos de Gemini que se destacan en el procesamiento multimodal. Estos modelos están disponibles para su uso de forma gratuita, y puedes publicar sus resultados siempre que cumplas con sus condiciones de licencia. Vertex AI ofrece modelos de código abierto y de pesos abiertos.

Cuando usas un modelo abierto con Vertex AI, usas Vertex AI para tu infraestructura. También puedes usar modelos abiertos con otros productos de infraestructura, como PyTorch o Jax.

Modelos de peso abierto

Muchos modelos abiertos se consideran modelos de lenguaje grandes (LLM) de ponderación abierta. Los modelos de ponderación abierta proporcionan más transparencia que los modelos que no son de ponderación abierta. Las ponderaciones de un modelo son los valores numéricos almacenados en la arquitectura de red neuronal del modelo que representan los patrones y las relaciones aprendidos de los datos con los que se entrena un modelo. Se publican los parámetros previamente entrenados, o ponderaciones, de los modelos de ponderación abierta. Puedes usar un modelo de ponderación abierta para la inferencia y el ajuste. No siempre se proporcionan detalles como el conjunto de datos original, la arquitectura del modelo y el código de entrenamiento.

Modelos de código abierto

Los modelos abiertos difieren de los modelos de IA de código abierto. Si bien los modelos abiertos suelen exponer los pesos y la representación numérica principal de los patrones aprendidos, no necesariamente proporcionan el código fuente completo ni los detalles del entrenamiento. Por otro lado, los modelos de código abierto suelen poner a disposición del público todo el código base, incluidos los datos y las secuencias de comandos de entrenamiento. Proporcionar ponderaciones ofrece un nivel de transparencia del modelo de IA, lo que te permite comprender las capacidades del modelo sin tener que compilarlo por tu cuenta.

Modelos de socios con autoimplementación

Model Garden te ayuda a comprar y administrar licencias de modelos de socios que ofrecen modelos propios como opción de autoimplementación. Puedes acceder a estos modelos a través de Cloud Marketplace. Después de obtener una licencia, puedes optar por realizar la implementación en hardware a pedido o usar tus reservas de Compute Engine y descuentos por compromiso de uso existentes para administrar los costos. Con los modelos de socios implementados por el usuario, se te factura tanto el uso del modelo como la infraestructura subyacente de Vertex AI que se consumió.

Para solicitar el uso de un modelo de socio con autoimplementación, sigue estos pasos:

  1. Navega a la consola de Model Garden.
  2. Busca el modelo de socio pertinente.
  3. Haz clic en Habilitar y completa el formulario proporcionado para obtener las licencias de uso comercial necesarias.

Si deseas obtener más información para implementar y usar modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción.

Consideraciones

Cuando uses modelos de socios con autoimplementación, ten en cuenta lo siguiente:

  • Exportación de pesos: A diferencia de lo que sucede con algunos modelos abiertos, no puedes exportar los pesos de los modelos de socios con autoimplementación.
  • Tipo de extremo: Solo se admite el tipo de extremo público compartido para estas implementaciones.

Más información sobre los modelos de implementación propia en Vertex AI