Ottimizzare gli LLM utilizzando le GPU con i job Cloud Run

Puoi eseguire il fine tuning di un modello Gemma 3 in un job Cloud Run, quindi utilizzare il modello di cui è stato eseguito il fine tuning in un servizio Cloud Run utilizzando vLLM.

Consulta un codelab didattico passo passo all'indirizzo Come ottimizzare un modello utilizzando i job Cloud Run.