הפעלת הסקה של LLM במעבדי GPU ב-Cloud Run באמצעות Hugging Face Transformers.js

ה-Codelab הבא מראה איך להריץ שירות לקצה העורפי שמריץ את החבילה Transformers.js. חבילת Transformers.js שוות ערך מבחינת הפונקציונליות לספריית ה-Python של Hugging Face transformers יחד עם מודל Gemma 2 של Google.

אפשר לעיין בכל ה-codelab במאמר How to Run Transformers.js on Cloud Run GPUs.