שיפור מודלים גדולים של שפה (LLM) באמצעות מעבדי GPU עם משימות של Cloud Run

אפשר לבצע התאמה עדינה של מודל Gemma 3 במשימת Cloud Run, ואז להפעיל את המודל שעבר התאמה עדינה בשירות Cloud Run באמצעות vLLM.

במאמר איך מבצעים כוונון עדין של מודל באמצעות משימות Cloud Run מופיע Codelab עם הוראות שלב אחר שלב.