Model Garden es una biblioteca de modelos de IA/AA que te ayuda a descubrir, probar, personalizar y, luego, implementar modelos y recursos de Google y sus socios.
Ventajas de Model Garden
Cuando trabajas con modelos de IA, Model Garden proporciona las siguientes ventajas:
- Los modelos disponibles se agrupan en una sola ubicación.
- Model Garden proporciona un patrón de implementación coherente para diferentes tipos de modelos.
- Model Garden proporciona integración integrada con otras partes de Gemini Enterprise Agent Platform, como el ajuste, la evaluación y la entrega de modelos.
- La entrega de modelos de IA generativa puede ser difícil. Gemini Enterprise Agent Platform se encarga de la implementación y la entrega de modelos por ti.
Explora modelos
Para ver la lista de modelos de base, ajustables y para tareas específicas, tanto de código abierto como de Gemini Enterprise Agent Platform, ve a la página Model Garden en la Google Cloud consola.
Las categorías de modelos disponibles en Model Garden son las siguientes:
| Categoría | Descripción |
|---|---|
| Modelos de base | Modelos grandes multitarea previamente entrenados que se pueden ajustar o personalizar para tareas específicas con Agent Studio, la API de Agent Platform y el SDK de Agent Platform. |
| Modelos ajustables | Modelos que puedes ajustar mediante un notebook o una canalización personalizados. |
| Soluciones específicas para tareas | La mayoría de estos modelos precompilados están listos para usar. Muchos se pueden personalizar con tus propios datos. |
Para filtrar modelos en el panel de filtro, especifica lo siguiente:
- Tareas: haz clic en la tarea que deseas que realice el modelo.
- Colecciones de modelos: Haz clic para elegir modelos que administren Google, los socios o tú.
- Proveedores: Haz clic en el proveedor del modelo.
- Atributos: Haz clic en los atributos que desees en el modelo.
Para obtener más información sobre cada modelo, haz clic en su ficha del modelo.
Análisis de seguridad de modelos
Google realiza pruebas y comparativas exhaustivas en los contenedores de entrega y ajuste que proporcionamos. También se aplica el análisis de vulnerabilidades activo a los artefactos de contenedores.
Los modelos de terceros de socios destacados se someten a análisis de puntos de control de modelos para garantizar la autenticidad. HuggingFace y su analizador de terceros analizan directamente los modelos de terceros de HuggingFace Hub en busca de software malicioso, archivos pickle, capas de Keras Lambda y secretos. HuggingFace marca los modelos que se consideran inseguros a partir de estos análisis y se bloquea su implementación en Model Garden. Los modelos que se consideran sospechosos o que tienen la capacidad de ejecutar código remoto se indican en Model Garden, pero aún se pueden implementar. Te recomendamos que realices una revisión exhaustiva de cualquier modelo sospechoso antes de implementarlo en Model Garden.
Precios
En el caso de los modelos de código abierto en Model Garden, se te cobra por el uso de lo siguiente en Gemini Enterprise Agent Platform:
- Ajuste de modelos: Se te cobra por los recursos de computación que se usan con la misma tarifa que el entrenamiento personalizado. Consulta los precios de entrenamiento personalizado.
- Implementación de modelos: Se te cobra por los recursos de procesamiento que se usan para implementar el modelo en un extremo. Consulta precios de las predicciones.
- Colab Enterprise: Consulta los precios de Colab Enterprise.
Controla el acceso a modelos específicos
Puedes establecer una política de la organización de Model Garden a nivel de la organización, la carpeta o el proyecto para controlar el acceso a modelos específicos en Model Garden. Por ejemplo, puedes permitir el acceso a modelos específicos que hayas investigado y rechazar el acceso a todos los demás.
Más información sobre Model Garden
Para obtener más información sobre las opciones de implementación y las personalizaciones que puedes realizar con los modelos en Model Garden, consulta los recursos de las siguientes secciones, que incluyen vínculos a instructivos, referencias, notebooks y videos de YouTube.
Implementación y entrega
Obtén más información para personalizar las implementaciones y las funciones avanzadas de entrega.
- Implementa y entrega modelos de código abierto con el SDK de Python, la CLI, la API de REST o la consola.
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
- Implementa Gemma y haz predicciones
- Entrega modelos abiertos con un contenedor de Hex-LLM en Cloud TPU
- Notebook del instructivo para implementar modelos de Llama con Hex-LLM
- Notebook del instructivo para usar el almacenamiento en caché de prefijos y la decodificación especulativa con Hex-LLM o vLLM
- Usa vLLM para entregar modelos de lenguaje solo de texto y multimodales en GPU de Cloud.
- Usa el contenedor de entrega de GPU de xDiT para la generación de imágenes y videos
- Instructivo en Medium sobre la entrega de Gemma 2 usando varios adaptadores LoRA con DLC de Hugging Face para la inferencia de PyTorch
- Instructivo en LinkedIn sobre cómo usar controladores personalizados para entregar PaliGemma y subtitular imágenes con DLC de Hugging Face para la inferencia de PyTorch
- Implementa y entrega un modelo que usa VMs Spot o un notebook del instructivo de reservas de Compute Engine.
- Implementa y entrega un modelo de Hugging Face
Ajuste
Obtén más información para ajustar modelos y adaptar las respuestas a casos de uso específicos.
- Notebook del instructivo de ajuste de Workbench
- Notebook del instructivo de ajuste y evaluación
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
Evaluación
Obtén más información para evaluar las respuestas del modelo con Agent Platform.
Recursos adicionales
- Notebooks de Model Garden específicos del modelo y del recorrido del usuario
- Notebooks de entrega, ajuste y evaluación de modelos abiertos de Agent Platform de Gemini Enterprise