Ajustar LLMs usando GPUs com jobs do Cloud Run

É possível ajustar um modelo Gemma 3 em um job do Cloud Run e disponibilizar o modelo ajustado em um serviço do Cloud Run usando o vLLM.

Confira um codelab com instruções detalhadas em Como ajustar um modelo usando jobs do Cloud Run.

Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.

Última atualização 2026-03-03 UTC.