מדריכים לארכיטקטורה של AI גנרטיבי

Last reviewed 2025-01-06 UTC

במסמך הזה במרכז הארכיטקטורה מפורטים מדריכים לארכיטקטורה שיעזרו לכם ליצור ולפרוס עומסי עבודה של AI גנרטיבי ב- Google Cloud.

כדי ללמוד איך להגדיר, לפרוס, להעריך ולהפעיל אפליקציות של AI גנרטיבי במודלים בסיסיים, אפשר לעיין במאמר פריסה והפעלה של אפליקציות של AI גנרטיבי.

ארכיטקטורות ברמה גבוהה

המדריכים הבאים מספקים ארכיטקטורות ברמה גבוהה לתרחישי שימוש ספציפיים ב-AI גנרטיבי בעסקים ובטכנולוגיה:

מדריך תיאור
יצירת קמפיינים שיווקיים בהתאמה אישית יצירת נכסי מדיה לקמפיינים שיווקיים מותאמים אישית.
יצירת המלצות למוצרים בהתאמה אישית יצירת המלצות מותאמות אישית למוצרים על סמך העדפות המשתמשים באפליקציות קמעונאיות.
יצירת פודקאסטים מקובצי אודיו ליצור פודקאסטים על סמך קובצי מדיה, כמו פרשנות בשידור חי לאירוע ספורט.
יצירת פתרונות לבקשות תמיכה של לקוחות ליצור תשובות לשאלות של לקוחות, כמו בקשות לתמיכה טכנולוגית.

תרשימי עזר לארכיטקטורה

במדריכים הבאים מופיעות דוגמאות מפורטות לארכיטקטורה והמלצות לעיצוב של פריסת תשתיות ועומסי עבודה של AI גנרטיבי לתרחישי שימוש ספציפיים:

מדריך תיאור
אוטומציה של בדיקת ניצול בתביעות ביטוח לשפר את תהליך האישור מראש (PA) ובדיקת הניצול (UR) של תביעות לביטוח בריאות.
תשתית RAG באמצעות Gemini Enterprise ו-Vertex AI ארגון של תהליך עבודה מבוסס-סוכן של RAG עם נתונים בזמינות בזמן אמת וחיפוש הקשרי מועשר.
תשתית RAG באמצעות Vertex AI ו-Vector Search חיפוש וקטורי מותאם לביצועים גבוהים עבור אפליקציות בקנה מידה גדול.
תשתית RAG באמצעות Vertex AI ו-AlloyDB ל-PostgreSQL אחסון של הטמעות וקטוריות לצד נתונים תפעוליים במסד נתונים מנוהל לחלוטין של AlloyDB ל-PostgreSQL.
RAG infrastructure using Vertex AI and Cloud SQL אחסון הטמעות וקטוריות לצד נתונים תפעוליים במסד נתונים מנוהל של Cloud SQL.
תשתית RAG באמצעות GKE ו-Cloud SQL ליצור אפליקציות RAG בהתאמה אישית באמצעות כלים בקוד פתוח כמו Ray,‏ Hugging Face ו-LangChain.
תשתית GraphRAG באמצעות Vertex AI ו-Spanner Graph לשלב חיפוש וקטורי עם שאילתות של תרשים ידע כדי לאחזר נתונים הקשריים שמקושרים זה לזה.
קישוריות פרטית לאפליקציות של בינה מלאכותית גנרטיבית עם יכולות RAG מאבטחים את תשתית הרשת של אפליקציות בינה מלאכותית גנרטיבית עם יכולות RAG באמצעות VPC משותף.
צינור עיבוד נתונים של Harness CI/CD לאפליקציות RAG איך מגדירים צינור עיבוד נתונים של אינטגרציה רציפה (CI) ופריסה רציפה (CD) לאפליקציות RAG.