Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

אוסף פתרונות ל-AI ב-Cloud Run

בדף הזה מופיעה רשימה של משאבים שיעזרו לכם ליצור ולפרוס פתרונות AI ב-Cloud Run.

‫Cloud Run היא פלטפורמה מנוהלת להרצת קוד, פונקציות או קונטיינרים על גבי התשתית של Google, שאפשר להתאים לעומס. אפשר להשתמש ב-Cloud Run כדי להריץ פתרונות AI שונים, כמו נקודות קצה של הסקת מסקנות מ-AI, ממשקי API של מודלים גנרטיביים, צינורות שלמים של יצירה משופרת באמצעות אחזור (RAG) ועוד.

אפשר להשתמש בקטגוריות ובקישורים שבהמשך כדי לנווט במדריכים רשמיים, במדריכי התחלה מהירה ובתוכן קהילתי שימושי. במאמר פתרונות AI ב-Cloud Run אפשר לקרוא על מסמכי עזרה והמלצות בנושא Cloud Run.

הערה לגבי משאבים קהילתיים

תוכן שמסומן כ'קהילה' הוא משאבים נבחרים מקהילת המפתחים, ו-Google לא מפתחת או מתחזקת אותו. חשוב לקרוא את האזהרות הבאות כשמשתמשים במקורות המידע האלה:

ביקורת אבטחה: חשוב לבדוק בקפידה כל קוד, במיוחד את האופן שבו הוא מטפל במידע פרטי, בקלט של משתמשים ובגישה לרשת.
הוצאה משימוש ועדכונים: יכול להיות שהקוד של הקהילה יהפוך למיושן או יפסיק לפעול עם תכונות חדשות של Cloud Run או גרסאות AI ללא אזהרה. בודקים את תאריך העדכון האחרון שלו ואם הוא עדיין מתוחזק באופן פעיל.
יעילות בעלויות: למרות שההגדרות האלה לרוב מכוונות לעלות נמוכה, יכול להיות שהן לא עומדות בשיטות המומלצות של Google לחיסכון בעלויות בפרויקטים פעילים. חשוב לעקוב מקרוב אחרי החיובים.
תאימות לרישיון: חשוב להבין את רישיון הקוד הפתוח של כל קוד או ספריות מהקהילה שמוסיפים לאפליקציה, ולפעול בהתאם לרישיון.
בדיקה לפני הפריסה: מומלץ לוודא שכל ההגדרות החשובות תקינות, ולנסות פתרונות של הקהילה בסביבת בדיקה לפני שמשתמשים בהם בפרויקטים פעילים.

סינון לפי קטגוריה או מילת מפתח

משתמשים במסננים או בתיבת החיפוש כדי למצוא תוכן לפי קטגוריה או מילת מפתח.

סינון לפי:

קטגוריות	שם ותיאור	תאריך הפרסום
בלוג Gemma 3	תרגול מעשי עם Gemma 3 ב-Google Cloud בפוסט הזה בבלוג מוצגים שני Codelabs שמראים למפתחים איך לפרוס את Gemma 3 ב-Google Cloud באמצעות Cloud Run לגישה בלי שרת (serverless) או Google Kubernetes Engine‏ (GKE) לגישה מבוססת-פלטפורמה.	2025-11-17
בלוג כלים	אוטומציה קלה של תהליכי עבודה של AI: פריסת n8n ב-Cloud Run בפוסט הזה בבלוג מוסבר איך לפרוס סוכנים באמצעות כלי האוטומציה של תהליכי העבודה n8n ב-Cloud Run, כדי ליצור תהליכי עבודה מבוססי-AI ולבצע שילוב עם כלים כמו Google Workspace.	2025-11-07
בלוג תוספים Gemini	אוטומציה של פריסת אפליקציות וניתוח אבטחה באמצעות תוספים חדשים ל-Gemini CLI בפוסט הזה בבלוג אנחנו מכריזים על התוסף Cloud Run ב-Gemini CLI, שמפשט את פריסת האפליקציות באמצעות פקודה אחת: ‎ /deploy.	2025-09-10
בלוג תוספים Gemini	ממארח מקומי לפריסה: פריסת אפליקציות AI פשוטה באמצעות Cloud Run ו-Docker Compose בפוסט הזה בבלוג אנחנו מכריזים על שיתוף פעולה בין Google Cloud לבין Docker, שמפשט את הפריסה של אפליקציות מורכבות מבוססות AI. שיתוף הפעולה הזה מאפשר למפתחים להשתמש בפקודה gcloud run compose up כדי לפרוס את קובצי ה-compose.yaml שלהם ישירות ל-Cloud Run.	2025-07-10
בלוג MCP	יצירה ופריסה של שרת MCP מרחוק ב-Google Cloud Run תוך פחות מ-10 דקות בפוסט הזה בבלוג מוסבר איך לבנות ולפרוס שרת מאובטח של פרוטוקול הקשר של המודל (MCP) ב-Google Cloud Run תוך פחות מ-10 דקות באמצעות FastMCP, ולאחר מכן לבדוק אותו מלקוח מקומי.	2025-06-07
Agents AI Studio בלוג MCP	פריסת AI פשוטה: אפשר לפרוס את האפליקציה ב-Cloud Run מ-AI Studio או מסוכני AI שתואמים ל-MCP בפוסט הזה בבלוג אנחנו מציגים דרכים לפשט את הפריסות של AI באמצעות פריסה בלחיצה אחת מ-AI Studio ל-Cloud Run, פריסה ישירה של מודלים של Gemma 3 ושרת MCP לפריסות מבוססות-סוכן.	2025-05-20
Agents בלוג תרחישים לדוגמה	מיזוג מהיר ב-50% ו-50% פחות באגים: איך CodeRabbit בנתה את סוכן בדיקת הקוד שלה באמצעות AI עם Google Cloud Run במאמר הזה נסביר איך כלי לביקורת קוד מבוסס-AI בשם CodeRabbit משתמש ב-Cloud Run כדי לבנות פלטפורמה מאובטחת וניתנת להרחבה להרצת קוד לא מהימן, ובסופו של דבר מקצר את זמן ביקורת הקוד ומקטין בחצי את מספר הבאגים.	2025-04-22
בלוג Vertex AI	יצירת אפליקציות AI גנרטיבי שאפשר לשתף תוך פחות מ-60 שניות באמצעות Vertex AI ו-Cloud Run במאמר הזה מוצגת תכונה ב-Vertex AI שמאפשרת פריסה של אפליקציות אינטרנט ב-Cloud Run בלחיצה אחת. אתם יכולים להשתמש בהנחיות ל-AI גנרטיבי כדי לייעל את התהליך של הפיכת קונספט של AI גנרטיבי לאב-טיפוס שאפשר לשתף.	2025-02-20
בלוג Deployment	איך פורסים AI ללא שרת באמצעות Gemma 3 ב-Cloud Run בפוסט הזה בבלוג מוכרז על Gemma 3, משפחה של מודלים קלי משקל של AI בקוד פתוח, ומוסבר איך לפרוס אותם ב-Cloud Run כדי ליצור אפליקציות AI מבוססות-שרת (serverless) שניתנות להרחבה וחסכוניות.	2025-03-12
בלוג GPUs הסקת מסקנות RAG Vertex AI	הפעלת הסקת מסקנות כשירות באמצעות Cloud Run ו-Vertex AI בפוסט הזה בבלוג מוסבר איך מפתחים יכולים להאיץ את הפיתוח של אפליקציות AI גנרטיבי באמצעות אימוץ מודל Inference-as-a-Service ב-Cloud Run. כך אפשר לארח מודלים גדולים של שפה (LLM) ולהרחיב אותם עם תמיכה ב-GPU, ולשלב אותם עם יצירה משופרת באמצעות אחזור (RAG) כדי לקבל תשובות שמתאימות להקשר.	2025-02-20
Frameworks Gemini LangChain	מדריך למתחילים: פיתוח ופריסה של אפליקציית אינטרנט ב-Python ‏ (LangChain) ב-Cloud Run במדריך למתחילים הזה נסביר איך לבנות ולפרוס אפליקציית LangChain באמצעות Cloud Run ו-Gemini כדי להשיב לשאילתות לגבי ערירות בירה.	2026-02-03
Agents Frameworks Gemini	מדריך למתחילים: איך יוצרים ומפעילים אפליקציית אינטרנט ב-Python ‏ (smolagents) ב-Cloud Run במדריך למתחילים הזה נסביר איך ליצור ולפרוס אפליקציית smolagents באמצעות Cloud Run ו-Gemini.	2026-01-28
ארכיטקטורה RAG Vertex AI	תשתית RAG ל-AI גנרטיבי באמצעות Vertex AI וחיפוש וקטורי במאמר הזה מוצגת ארכיטקטורת הפניה לפיתוח אפליקציה של בינה מלאכותית גנרטיבית עם יצירה מועשרת באחזור (RAG) ב-Google Cloud, תוך שימוש בחיפוש וקטורי להתאמת דמיון בקנה מידה גדול וב-Vertex AI לניהול הטמעות ומודלים.	2025-03-07
Agents Antigravity סרטון	Stop coding, start architecting: Google Antigravity + Cloud Run בסרטון הזה מוצג Antigravity, סביבת פיתוח משולבת (IDE) מבוססת-סוכן של Google. במדריך הזה נלמד איך להשתמש ב-Cloud Build כדי ליצור ולפרוס אפליקציית full stack ב-Cloud Run מאפס. בסרטון הזה תוכלו לראות איך לכתוב גיליון מפרט ל-AI, להכריח אותו להשתמש ב-Node.js מודרני (בלי שלבי בנייה!) ולראות אותו מנפה באגים באופן אוטונומי בחוסר התאמה של יציאות במהלך פריסה, תוך שינוי קובץ הגדרה.	2025-12-08
Agents GPUs Ollama סרטון	סוכן ה-AI הזה פועל ב-Cloud Run + מעבדים גרפיים של NVIDIA בסרטון הזה מוצג תהליך הפיתוח של אפליקציית סוכן AI אמיתית ב-GPU של NVIDIA ללא שרת. צפו בהדגמה של סוכן בריאות חכם שמשתמש במודלים בקוד פתוח כמו Gemma עם Ollama ב-Cloud Run, וב-LangGraph כדי ליצור תהליך עבודה מרובה סוכנים (RAG + כלים).	2025-11-13
MCP סרטון	הפעלת סוכני AI באמצעות כלי MCP ב-Google Cloud Run בסרטון הזה מוצג MCP (פרוטוקול הקשר של המודל) ומוסבר איך הוא מקל על החיים של מפתחי סוכני AI. הסבר מפורט על בניית שרת MCP באמצעות FastMCP ופריסת סוכן ADK ב-Cloud Run. אפשר לראות איך הקוד מטפל באימות משירות לשירות באמצעות אסימוני OIDC המובנים של Cloud Run.	2025-11-06
הגנה מוגברת על המודל אבטחה סרטון	ניסינו לפרוץ את ה-AI שלנו (ו-Model Armor עצר את זה) בסרטון הזה מוצגת דוגמה לשימוש ב-Model Armor של Google כדי לחסום איומים באמצעות קריאה ל-API.	2025-10-30
השוואה לשוק Vertex AI סרטון	אל תנחשו: איך משווים בין הנחיות ל-AI בסרטון הזה מוצגות דרכים להשתמש ב-Vertex AI כדי ליצור אפליקציות אמינות של AI גנרטיבי באמצעות הכלים של Google Cloud. מפתחים ילמדו איך להשתמש בכלים של Google Cloud ליצירת אב טיפוס מהיר, לקבל נתונים מדויקים באמצעות השוואה מבוססת-נתונים, ולבסוף, לבנות צינור CI/CD אוטומטי כדי להבטיח בקרת איכות אמיתית, תוך הימנעות מטעויות נפוצות.	2025-10-23
ADK Multi-agent סרטון	איך בונים אפליקציה מרובת סוכנים באמצעות ADK ו-Gemini בסרטון הזה מוסבר איך ליצור אפליקציה באמצעות ADK (ערכת כלים לפיתוח סוכנים) של Google, שעוזרת לכם לשפר תוכן ולשתף פעולה ביצירת תוכן. נבדוק איך שימוש בכמה סוכנים עם שמירת מצב עדיף על שימוש בסוכן יחיד.	2025-10-16
Gemini סרטון	איך יוצרים אפליקציית AI לצפייה בסרטונים באמצעות Gemini בסרטון הזה מוסבר איך ליצור אפליקציה שצופה בסרטוני YouTube ומבינה אותם באמצעות Gemini 2.5 Pro. אפשר להשתמש בהנחיות חכמות כדי להתאים אישית את התוצאות של האפליקציה לפוסטים בבלוג, לסיכומים, לחידונים ועוד. בסרטון הזה מוסבר איך לשלב את Gemini כדי ליצור תוכן טקסט ותמונות לכותרות מתוך קלט של סרטון, איך להתייחס לשיקולי עלות ואיך לטפל בסרטונים ארוכים יותר באמצעות בקשות אצווה.	2025-10-06
GenAI סרטון	יצירת אפליקציית GenAI ב-Cloud Run בסרטון הזה מוסברים הארכיטקטורה והקוד, עם עזרה מ-AI בכל שלב.	2025-07-17
Agents Firebase סרטון	יצירת סוכני AI באמצעות Cloud Run ו-Firebase Genkit בסרטון הזה מוצגות הוראות לבניית סוכני AI באמצעות Cloud Run ו-Firebase Genkit, כלי לבניית סוכני AI ללא שרת.	2025-07-10
AI Studio Firebase Gemini LLMs סרטון	‫Cloud AI: זה רק API בסרטון הזה מוצגת הדגמה של בניית אפליקציה לתמיכה טכנית במהירות באמצעות AI Studio,‏ Cloud Functions ואירוח ב-Firebase. בקורס הזה תלמדו איך להשתמש במודלים גדולים של שפה (LLM) ותראו דוגמה מעשית לשילוב של AI באפליקציית אינטרנט מסורתית.	2025-06-19
ADK Agents Frameworks LangGraph Vertex AI סרטון	פיתוח סוכני AI ב-Google Cloud בסרטון הזה מוסבר איך ליצור ולפרוס סוכני AI באמצעות Cloud Run ו-Vertex AI. תלמדו על מושגי מפתח כמו הפעלת כלים, שימוש במודלים שונים ושימוש במסגרות כמו LangGraph וערכת פיתוח הסוכנים (ADK).	2025-05-21
מודלים של AI GPUs Ollama סרטון	איך מארחים את DeepSeek באמצעות מעבדים גרפיים ל-Cloud Run ב-3 שלבים בסרטון הזה מוסבר איך לפשט את אירוח מודל DeepSeek AI באמצעות מעבדי GPU של Cloud Run. איך פורסים ומנהלים מודלים גדולים של שפה (LLM) ב-Google Cloud באמצעות שלוש פקודות. במהלך הצפייה תכירו את היכולות של Cloud Run ואת כלי שורת הפקודה Ollama, שמאפשרים למפתחים להפעיל במהירות אפליקציות AI עם הקצאה והתאמה לעומס של משאבים לפי דרישה.	2025-04-24
בקשה להפעלת פונקציה Gemini סרטון	איך משתמשים ב-Gemini function calling עם Cloud Run בסרטון הזה נסביר על היכולות של Gemini function calling ונלמד איך לשלב ממשקי API חיצוניים באפליקציות מבוססות-AI. פיתוח אפליקציית מזג אוויר שמסתמכת על יכולת ההבנה של שפה טבעית של Gemini כדי לעבד בקשות של משתמשים ולאחזר נתוני מזג אוויר מ-API חיצוני, כדוגמה מעשית לשימוש בפונקציות.	2025-01-23
יצירת תמונות Vertex AI סרטון	יצירת תמונה מטקסט באמצעות Vertex AI של Google Cloud ב-Cloud Run בסרטון הזה מוצג תהליך הפיתוח של אפליקציה ליצירת תמונות באמצעות Vertex AI ב-Google Cloud. בעזרת מודל ליצירת תמונות ב-Vertex AI, מפתחים יכולים ליצור תמונות מדהימות בלי צורך בתשתית מורכבת או בניהול מודלים.	2025-01-16
GPUs Ollama סרטון	‫Ollama ו-Cloud Run עם מעבדים גרפיים בסרטון הזה מוסבר איך להשתמש ב-Ollama כדי לפרוס בקלות מודלים גדולים של שפה ב-Cloud Run עם מעבדי GPU, לפריסה יעילה וניתנת להרחבה של מודלים של AI בענן.	2024-12-02
הגנה על נתונים אבטחה סרטון	הגנה על מידע אישי רגיש באפליקציות AI בסרטון הזה מוסבר איך להגן על מידע אישי רגיש באפליקציות AI. היכרות עם מושגי יסוד, שיטות מומלצות וכלים להגנה על נתונים לאורך מחזור החיים של ה-AI.	2024-11-21
LangChain RAG סרטון	RAG עם LangChain ב-Google Cloud בסרטון הזה מוצג איך לשפר את הדיוק של אפליקציות AI באמצעות יצירה משופרת עם אחזור (RAG). פיתוח אפליקציית אינטרנט שמבוססת על RAG עם LangChain, טכניקה שמשפרת את הדיוק של תשובות מבוססות-AI.	2024-11-07
חלון הנחיה גדול Model tuning RAG סרטון	RAG לעומת כוונון מודל לעומת חלון גדול של הנחיות בסרטון הזה נסביר על שלוש שיטות עיקריות לשילוב הנתונים שלכם באפליקציות AI: הנחיות עם חלונות הקשר ארוכים, יצירה עם שליפה משופרת (RAG) ושיפור מודלים. בפרק הזה של Serverless Expeditions, נסביר מהם היתרונות והמגבלות של כל גישה, ומהם תרחישי השימוש האידיאליים שלה, כדי שתוכלו לקבל החלטות מושכלות לגבי פרויקטי ה-AI שלכם.	2024-11-14
הנדסת הנחיות סרטון	הנדסת הנחיות למפתחים בסרטון הזה תגלו איך להשתמש בהנדסת הנחיות כדי לשפר את האיכות של תשובות שנוצרו על ידי AI. בסרטון הזה נסביר איך להשתמש בטכניקות של הנחיות בשרשרת מחשבה, הנחיות עם מעט דוגמאות והנחיות עם דוגמאות רבות כדי לקבל תשובות מדויקות ורלוונטיות יותר מ-AI גנרטיבי.	2024-10-31
מודלים של AI GPUs LLMs סרטון	פריסת מודל שפה גדול (LLM) מבוסס-GPU ב-Cloud Run בסרטון הזה מוסבר איך אפשר לפרוס מודל שפה גדול (LLM) משלכם שמבוסס על GPU ב-Cloud Run. בסרטון הזה מוסבר איך לקחת מודל קוד פתוח כמו Gemma ולפרוס אותו כשירות ניתן להרחבה, ללא שרת (serverless) עם האצת GPU	2024-10-06
GPUs LLMs Ollama סרטון	שימוש במעבדים גרפיים ב-Cloud Run בסרטון הזה מוצגת הדגמה של פריסת Gemma 2 של Google, מודל שפה גדול בקוד פתוח, דרך Ollama ב-Cloud Run.	2024-10-03
Gemini LLMs סרטון	פיתוח אפליקציות צ'אט מבוססות-AI ב-Google Cloud בסרטון הזה מוצגות הוראות לבניית אפליקציית צ'אט עם מודל שפה גדול (LLM) ב-Gemini.	2024-08-29
Multimodal Vertex AI סרטון	AI מולטימודאלי בסרטון הזה מוצגת הדגמה של שימוש ב-Vertex AI כדי ליצור אפליקציית multimodal שמבצעת עיבוד של סרטונים, אודיו וטקסט כדי ליצור פלט.	2024-08-15
מודלים של AI Vertex AI סרטון	שימוש ב-AI גנרטיבי ללא שרת \| Google Vertex AI בסרטון הזה מוצגות הוראות ליצירה ולפריסה של אפליקציות מהירות במיוחד של בינה מלאכותית גנרטיבית באמצעות Vertex AI Studio,‏ Cloud Run ומודלים של בינה מלאכותית גנרטיבית.	2024-02-22
Codelab כלים	פריסה והפעלה של n8n ב-Google Cloud Run ב-Codelab הזה תלמדו איך לפרוס ב-Cloud Run מופע מוכן לייצור של כלי האוטומציה של תהליכי העבודה n8n, כולל מסד נתונים של Cloud SQL לשימור נתונים ו-Secret Manager למידע אישי רגיש.	2025-11-20
Codelab GPUs LLMs	איך מריצים הסקה של LLM במעבדים גרפיים של Cloud Run באמצעות vLLM ו-OpenAI Python SDK Codelab זה מראה איך לפרוס את מודל Gemma 2 2b של Google שעבר כוונון להוראות ב-Cloud Run עם GPUs, באמצעות vLLM כמנוע היקש ו-OpenAI Python SDK כדי לבצע השלמת משפטים.	2025-11-13
ADK Agents Codelab	פריסה, ניהול ומעקב של סוכן ADK ב-Cloud Run ב-Codelab הזה תלמדו איך לפרוס, לנהל ולנטר סוכן חזק שנבנה באמצעות ערכה לפיתוח סוכנים (ADK) ב-Cloud Run.	2025-11-12
Codelab Gemini CLI MCP	איך פורסים שרת MCP מאובטח ב-Cloud Run ב-codelab הזה מוסבר איך לפרוס שרת מאובטח של Model Context Protocol‏ (MCP) ב-Cloud Run ואיך להתחבר אליו מ-Gemini CLI.	2025-10-28
ADK Agents Codelab MCP	פיתוח ופריסה של סוכן ADK שמשתמש בשרת MCP ב-Cloud Run Codelab זה מנחה אתכם בבנייה ובפריסה של סוכן AI שמשתמש בכלים באמצעות ערכה לפיתוח סוכנים (ADK). הסוכן מתחבר לשרת MCP מרוחק כדי לקבל את הכלים שלו, והוא נפרס כקונטיינר ב-Cloud Run.	2025-10-27
מודלים של AI משימות ב-Cloud Run Codelab Model tuning	איך מבצעים כוונון עדין של מודל LLM באמצעות Cloud Run Jobs ה-Codelab הזה מספק מדריך מפורט על איך להשתמש ב-Cloud Run Jobs עם GPUs כדי לבצע כוונון עדין של מודל Gemma 3 במערך הנתונים Text2Emoji, ואז להפעיל את המודל שנוצר בשירות Cloud Run עם vLLM.	2025-10-21
הסקת מסקנות באצווה משימות ב-Cloud Run Codelab	איך מריצים הסקת מסקנות באצווה במשימות של Cloud Run ב-Codelab הזה תלמדו איך להשתמש בעבודת Cloud Run שמבוססת על GPU כדי להריץ היקש באצווה במודל Llama 3.2-1b ולכתוב את התוצאות ישירות לקטגוריה של Cloud Storage.	2025-10-21
ADK Agents Codelab GPUs LLMs MCP	‫Lab 3:Prototype to Production - Deploy Your ADK Agent to Cloud Run with GPU ב-Codelab הזה תלמדו איך לפרוס סוכן של ערכה לפיתוח סוכנים (ADK) שמוכן לייצור עם בק-אנד של Gemma מואץ GPU ב-Cloud Run. ב-codelab מוסבר על פריסה, שילוב ובדיקת ביצועים.	2025-10-03
Agents Codelab	איך פורסים אפליקציית Gradio frontend שקוראת לסוכן ADK backend, כששניהם פועלים ב-Cloud Run ה-Codelab הזה מדגים איך לפרוס אפליקציה דו-שכבתית ב-Cloud Run, שכוללת קצה קדמי של Gradio ובק-אנד של ADK Agent, עם דגש על הטמעה של תקשורת מאובטחת ומאומתת בין שירותים.	2025-09-29
Codelab Gemini	איך פורסים אפליקציית צ'אטבוט של FastAPI ב-Cloud Run באמצעות Gemini ב-Codelab הזה תלמדו איך לפרוס אפליקציית צ'אט בוט של FastAPI ב-Cloud Run.	2025-04-02
פונקציות Cloud Run Codelab LLMs	איך לארח מודל LLM ב-sidecar עבור פונקציית Cloud Run בשיעור הזה תלמדו איך לארח מודל gemma3:4b ב-sidecar עבור פונקציית Cloud Run.	2025-03-27
קהילה אבטחה	קריאה מאובטחת לשירות Cloud Run מכל מקום במאמר הזה מופיעה דוגמה לקוד Python שמקבל אסימון זהות כדי לקרוא בצורה מאובטחת לשירות Cloud Run מאומת מכל סביבה. בדוגמה הזו נעשה שימוש ב-Application Default Credentials‏ (ADC) כדי לאמת את הקריאה.	2025-10-15
מודלים של AI קהילה RAG	AI ללא שרת: הטמעה של Gemma באמצעות Cloud Run במאמר הזה מוסבר איך להוסיף את מודל EmbeddingGemma לקונטיינר ולפרוס אותו ב-Cloud Run עם מעבדי GPU, ואז להשתמש בו כדי ליצור אפליקציית RAG.	2025-09-24
קהילה אבטחה	שרשרת אמון ל-AI: אבטחת ארכיטקטורת MCP Toolbox ב-Cloud Run במאמר הזה ננתח אפליקציה פשוטה להזמנת חדרים במלון שנבנתה ב-Google Cloud. הוא מדגים מודל אבטחה חזק של אפס אמון באמצעות זהויות שירות, ומראה איך נוצר שרשרת אמון מאובטחת ממשתמש הקצה ועד למסד הנתונים.	2025-09-03
מודלים של AI קהילה Containerization Docker Ollama RAG	AI בלי שרת (serverless): Qwen3 Embeddings עם Cloud Run במאמר הזה מוסבר איך לפרוס את מודל ה-Embedding‏ Qwen3 ב-Cloud Run עם מעבדי GPU. במאמר מוסבר גם על קונטיינריזציה באמצעות Docker ו-Ollama, ומוצגת דוגמה לשימוש בהם באפליקציית RAG.	2025-08-20
ארכיטקטורה קהילה LLMs	עדיין אורזים מודלים של AI בקונטיינרים? במקום זאת, אפשר לעשות את זה ב-Cloud Run במאמר הזה אנחנו מציעים ארכיטקטורה יעילה יותר וניתנת להרחבה להפעלת מודלים גדולים של שפה (LLM) ב-Cloud Run. הארכיטקטורה הזו מבוססת על הפרדה בין קובצי המודל לבין קונטיינר האפליקציה, ושימוש ב-Cloud Storage FUSE במקום זאת.	2025-08-11
מודלים של AI קהילה	יצירת גנרטור פודקאסטים מבוסס-AI באמצעות Gemini ו-Cloud Run במאמר הזה מוסבר איך ליצור כלי ליצירת פודקאסטים מבוסס-AI ללא שרת, שמשתמש ב-Gemini לסיכום תוכן וב-Cloud Run. בדוגמה הזו מוצג צינור אוטומטי לעיבוד נתונים ליצירה ולשליחה של תדריכים יומיים של אודיו מפידים של RSS.	2025-08-11
קהילה MCP	הפעלת שרתי MCP באמצעות Google Cloud Run במאמר הזה נסביר מה המטרה של פרוטוקול הקשר של המודל (MCP) ונספק מדריך להגדרה ולפריסה של שרת MCP ב-Cloud Run כדי לחשוף משאבים ככלים לאפליקציות AI.	2025-07-09
קהילה מודלים של למידת מכונה Monitoring	פריסה ומעקב אחרי מודלים של ML באמצעות Cloud Run – קל משקל, ניתן להתאמה וחסכוני במאמר הזה מוסבר איך לפרוס מודל למידת מכונה ב-Cloud Run, לעקוב אחרי הביצועים שלו ולשנות את גודל המודל באופן אוטומטי. כדי לעשות את זה, משתמשים במערכת קלה למעקב עם שירותי Google Cloud כדי לעקוב אחרי הביצועים ולשלוט בעלויות.	2025-05-29
מודלים של AI AI Studio קהילה LLMs	הטמעה של Gemma ישירות מ-AI Studio ב-Cloud Run במאמר הזה מופיע מדריך מפורט שמסביר איך לקחת מודל Gemma מ-AI Studio, להתאים את הקוד שלו לייצור ולפרוס אותו כאפליקציית אינטרנט מבוססת-קונטיינר ב-Cloud Run.	2025-05-29
ADK Agents קהילה MCP	שלושת מרכיבי הארכיטקטורה של הסוכן: ADK,‏ MCP ו-Cloud Run במאמר הזה נסביר איך לבנות ארכיטקטורה של סוכן AI על ידי הגדרת תהליך עבודה של Agent Development Kit ‏ (ADK) שמתקשר עם שרת Model Context Protocol ‏ (MCP) שמתארח ב-Cloud Run כדי לנהל הזמנות של טיסות.	2025-05-27
A2A Agents קהילה Frameworks תרחישים לדוגמה	הסבר על פרוטוקול Agent2Agent‏ (A2A) עם תרחיש לדוגמה של עוזר קניות ב-Cloud Run במאמר הזה נסביר על פרוטוקול Agent2Agent ‏ (A2A) ונדגים את השימוש בו באפליקציית קנייה אישית. אפליקציית Cloud Run מכילה כמה סוכני AI, שנבנו באמצעות מסגרות שונות, והם משתפים פעולה ביניהם כדי למלא הזמנה של משתמש.	2025-05-15
מודלים של AI אוטומציה CI/CD קהילה GitHub	אוטומציה של פריסת מודלים של ML באמצעות GitHub Actions ו-Cloud Run במאמר הזה מוסבר איך ליצור צינור CI/CD באמצעות GitHub Actions כדי להפוך לאוטומטיות את הבנייה והפריסה של מודלים של למידת מכונה כשירותים מבוססי-קונטיינר ב-Cloud Run.	2025-05-08
קהילה LLMs אבטחה	פיתוח פתרונות AI ריבוניים באמצעות Google Cloud – Cloud Run במאמר הזה מוסבר איך ליצור ולפרוס פתרון AI ריבוני ב-Google Cloud באמצעות Sovereign Controls by Partners. בדוגמאות מופעל מודל Gemma ב-Cloud Run, כדי להבטיח את מיקום הנתונים ועמידה בתקנות האירופאיות.	2025-04-03
קהילה LLMs	From Zero to Deepseek on Cloud Run during my morning commute במאמר הזה מוסבר איך לפרוס במהירות את מודל Deepseek R1 ב-Cloud Run עם מעבדי GPU באמצעות Ollama במהלך נסיעה בבוקר. במאמר הזה נסביר על נושאים מתקדמים כמו הטמעת המודל במאגר, בדיקות A/B עם פיצול תנועה והוספת ממשק משתמש לאינטרנט עם מאגר sidecar.	2025-02-11
קהילה LLMs Ollama	איך מריצים (כל) מודל שפה גדול (LLM) בקוד פתוח באמצעות Ollama ב-Google Cloud Run [הוראות מפורטות] במאמר הזה מוסבר איך לארח כל מודל שפה גדול (LLM) בקוד פתוח, כמו Gemma 2, ב-Google Cloud Run באמצעות Ollama. במאמר מוסבר גם איך ליצור קטגוריה של Cloud Storage לשמירת המודל ואיך לבדוק את הפריסה.	2025-01-20
קהילה מודלים של למידת מכונה	פריסה של מודלים של למידת מכונה ללא שרת עם מעבדי GPU באמצעות Google Cloud: Cloud Run במאמר הזה מוסבר איך לפרוס מודל של למידת מכונה (ML) עם תמיכה ב-GPU ב-Cloud Run. במאמר מוסבר על כל השלבים, החל מהגדרת הפרויקט והפיכת האפליקציה לקונטיינר, ועד לפריסה אוטומטית באמצעות Cloud Build ובדיקה באמצעות curl ו-JavaScript.	2025-01-17

אוסף פתרונות ל-AI ב-Cloud Run קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

הערה לגבי משאבים קהילתיים

סינון לפי קטגוריה או מילת מפתח

אוסף פתרונות ל-AI ב-Cloud Run