Model Garden es una biblioteca de modelos de IA/AA que te ayuda a descubrir, probar, personalizar y, luego, implementar modelos y recursos de Google y sus socios.
Ventajas de Model Garden
Cuando trabajas con modelos de IA, Model Garden proporciona las siguientes ventajas:
- Todos los modelos disponibles se agrupan en una sola ubicación.
- Model Garden proporciona un patrón de implementación coherente para diferentes tipos de modelos.
- Model Garden proporciona integración integrada con otras partes de Agent Platform de Gemini Enterprise, como el ajuste, la evaluación y la entrega de modelos.
- La entrega de modelos de IA generativa puede ser difícil. Agent Platform de Gemini Enterprise se encarga de la implementación y la entrega de modelos por ti.
Explora modelos
Para ver la lista de Agent Platform de Gemini Enterprise disponibles y los modelos específicos para tareas, ajustables y de base de código abierto, ve a la página Model Garden en la Google Cloud consola.
Las categorías de modelos disponibles en Model Garden son las siguientes:
| Categoría | Descripción |
|---|---|
| Modelos de base | Modelos grandes multitarea previamente entrenados que se pueden ajustar o personalizar para tareas específicas con Agent Studio, la API de Agent Platform y el SDK de Agent Platform. |
| Modelos ajustables | Modelos que puedes ajustar mediante un notebook o una canalización personalizados. |
| Soluciones específicas para tareas | La mayoría de estos modelos precompilados están listos para usar. Muchos se pueden personalizar con tus propios datos. |
Para filtrar modelos en el panel de filtro, especifica lo siguiente:
- Tareas: haz clic en la tarea que deseas que realice el modelo.
- Colecciones de modelos: Haz clic para elegir modelos que administren Google, los socios o tú.
- Proveedores: Haz clic en el proveedor del modelo.
- Atributos: Haz clic en los atributos que desees en el modelo.
Para obtener más información sobre cada modelo, haz clic en la tarjeta del modelo.
Para obtener una lista de los modelos disponibles en Model Garden, consulta Modelos disponibles en Model Garden.
Análisis de seguridad de modelos
Google realiza pruebas y comparativas exhaustivas en los contenedores de entrega y ajuste que proporcionamos. También se aplica el análisis de vulnerabilidades activo a los artefactos de contenedores.
Los modelos de terceros de los socios destacados se someten a análisis de puntos de control de modelos para garantizar la autenticidad. HuggingFace y su analizador de terceros analizan directamente los modelos de terceros de HuggingFace Hub en busca de software malicioso, archivos pickle, capas de Keras Lambda y secretos. HuggingFace marca los modelos que se consideran inseguros a partir de estos análisis y se bloquea su implementación en Model Garden. Los modelos que se consideran sospechosos o que tienen la capacidad de ejecutar código remoto se indican en Model Garden, pero aún se pueden implementar. Te recomendamos que realices una revisión exhaustiva de cualquier modelo sospechoso antes de implementarlo en Model Garden.
Precios
En el caso de los modelos de código abierto en Model Garden, se te cobra por el uso de lo siguiente en Agent Platform de Gemini Enterprise:
- Ajuste de modelos: Se te cobra por los recursos de computación que se usan con la misma tarifa que el entrenamiento personalizado. Consulta los precios de entrenamiento personalizado.
- Implementación de modelos: Se te cobra por los recursos de procesamiento que se usan para implementar el modelo en un extremo. Consulta precios de las predicciones.
- Colab Enterprise: Consulta los precios de Colab Enterprise.
Controla el acceso a modelos específicos
Puedes establecer una política de la organización de Model Garden a nivel de la organización, la carpeta o el proyecto para controlar el acceso a modelos específicos en Model Garden. Por ejemplo, puedes permitir el acceso a modelos específicos que hayas investigado y rechazar el acceso a todos los demás.
Más información sobre Model Garden
Para obtener más información sobre las opciones de implementación y las personalizaciones que puedes realizar con los modelos en Model Garden, consulta los recursos de las siguientes secciones, que incluyen vínculos a instructivos, referencias, notebooks y videos de YouTube.
Implementación y entrega
Obtén más información para personalizar las implementaciones y las funciones avanzadas de entrega.
- Implementa y entrega un modelo de código abierto con el SDK de Python, la CLI, la API de REST o la consola.
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
- Implementa Gemma y haz predicciones
- Entrega modelos abiertos con un contenedor de Hex-LLM en Cloud TPU
- Implementa modelos de Llama con el notebook instructivo de Hex-LLM
- Usa el almacenamiento en caché de prefijos y la decodificación especulativa con el notebook instructivo de Hex-LLM o vLLM
- Usa vLLM para entregar modelos de lenguaje solo de texto y multimodales en GPU de Cloud.
- Usa el contenedor de entrega de GPU de xDiT para la generación de imágenes y videos
- Instructivo en Medium sobre la entrega de Gemma 2 usando varios adaptadores LoRA con DLC de Hugging Face para la inferencia de PyTorch
- Instructivo en LinkedIn sobre cómo usar controladores personalizados para entregar PaliGemma y subtitular imágenes con DLC de Hugging Face para la inferencia de PyTorch
- Implementa y entrega un modelo que usa VMs Spot o un notebook del instructivo de reservas de Compute Engine.
- Implementa y entrega un modelo de Hugging Face
Ajuste
Obtén más información para ajustar modelos y adaptar las respuestas a casos de uso específicos.
- Notebook del instructivo de ajuste de Workbench
- Notebook del instructivo de ajuste y evaluación
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
Evaluación
Obtén más información para evaluar las respuestas del modelo con Agent Platform.
Recursos adicionales
- Notebooks de Model Garden específicos del modelo y del recorrido del usuario
- Notebooks de entrega de modelos, ajuste y evaluación de modelos abiertos de Agent Platform de Gemini Enterprise