Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Obtén información sobre la investigación y la ingeniería aplicadas en IA de Cloud

Artículo destacado

Cómo cerrar la brecha de eficiencia en la entrega de LLM con el alojamiento conjunto de modelos con Vertex AI

En el panorama en evolución de los modelos de lenguaje grandes (LLM), el patrón de implementación "un modelo por máquina" se está convirtiendo en un cuello de botella importante para la eficiencia en los costos de la entrega de LLM en las empresas. El alojamiento conjunto de modelos aborda esta brecha de eficiencia, ya que permite que varias instancias de modelos compartan los mismos recursos de máquina virtual y GPUs. En este blog técnico, se detalla el proceso de Vertex AI Engineering para llevar el alojamiento conjunto de modelos a un servicio en la nube listo para producción.

Leer artículo