הפעלת הסקת מסקנות באצווה באמצעות מעבדי GPU במשימות Cloud Run

אפשר להריץ הסקת מסקנות באצווה באמצעות מודל שפה גדול (LLM) Llama 3.2-1b של Meta ו-vLLM במשימת Cloud Run, ואז לכתוב את התוצאות ישירות ל-Cloud Storage באמצעות טעינת נפח (volume) של Cloud Run.

ב-How to run batch inference on Cloud Run jobs (איך להריץ היקש באצווה במשימות של Cloud Run) מופיע Codelab מפורט.

אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers‏.‏ Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.

עדכון אחרון: 2026-03-10 (שעון UTC).

הפעלת הסקת מסקנות באצווה באמצעות מעבדי GPU במשימות Cloud Run קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

הפעלת הסקת מסקנות באצווה באמצעות מעבדי GPU במשימות Cloud Run