הרצת הסקת מסקנות של מודל שפה גדול (LLM) ב-Cloud Run באמצעות Hugging Face TGI

בדוגמה הבאה מוסבר איך להריץ שירות קצה עורפי שמריץ את ערכת הכלים Hugging Face Text Generation Inference (TGI) באמצעות Llama 3. ‫Hugging Face TGI הוא מודל שפה גדול (LLM) בקוד פתוח, שאפשר לפרוס אותו ולהשתמש בו בשירות Cloud Run עם מעבדי GPU מופעלים.

אפשר לראות את הדוגמה המלאה במאמר פריסת Llama 3.1 8B באמצעות TGI DLC ב-Cloud Run.

אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers‏.‏ Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.

עדכון אחרון: 2026-03-10 (שעון UTC).

הרצת הסקת מסקנות של מודל שפה גדול (LLM) ב-Cloud Run באמצעות Hugging Face TGI קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

הרצת הסקת מסקנות של מודל שפה גדול (LLM) ב-Cloud Run באמצעות Hugging Face TGI