בחירת מודלים ותשתית לאפליקציית ה-AI הגנרטיבי
אירוח אפליקציות: מחשוב לאירוח האפליקציה. האפליקציה יכולה להשתמש בספריות הלקוח ובערכות ה-SDK של Google Cloud כדי לתקשר עם מוצרי Cloud שונים.
אירוח מודלים: אירוח מאובטח וניתן להרחבה של מודל גנרטיבי.
מודל: מודל גנרטיבי לטקסט, לצ'אט, לתמונות, לקוד, להטמעות ולמולטימודל.
פתרון להארקה: עיגון הפלט של המודל למקורות מידע שניתן לאמת ומתעדכנים.
מסד נתונים: אחסון הנתונים של האפליקציה. יכול להיות שתשתמשו מחדש במסד הנתונים הקיים כפתרון להארקה, על ידי הגדלת ההנחיות באמצעות שאילתת SQL, ו/או אחסון הנתונים כהטמעות וקטוריות באמצעות תוסף כמו pgvector.
אחסון: אחסון קבצים כמו תמונות, סרטונים או חזיתות סטטיות של אתרים. יכול להיות שתשתמשו ב-Storage גם בשביל נתוני ההארקה הגולמיים (למשל, קובצי PDF) שבהמשך ממירים להטמעות ומאחסנים במסד נתונים וקטורי.
בקטעים הבאים מפורטים כל אחד מהרכיבים האלה, כדי לעזור לכם לבחור אילו מוצרי Google Cloud כדאי לכם לנסות.
תשתית לאירוח אפליקציות
בוחרים מוצר לאירוח ולשירות של עומס העבודה של האפליקציה, ששולחת קריאות למודל הגנרטיבי.
תשתית לאירוח מודלים
Google Cloud מספקת כמה דרכים לאירוח מודל גנרטיבי, החל מפלטפורמת הדגל Vertex AI, ועד לאירוח שניתן להתאמה ולהעברה ב-Google Kubernetes Engine.
אתם משתמשים ב-Gemini וצריכים תכונות לארגונים כמו יכולת הרחבה, אבטחה, פרטיות נתונים ויכולת מעקב
האם המודל שלכם דורש ליבת מערכת הפעלה (kernel) מיוחדת, מערכת הפעלה מדור קודם או תנאי רישוי מיוחדים?
דגם
Google Cloud מספקת סדרה של מודלים בסיסיים חדשניים דרך Vertex AI , כולל Gemini. אפשר גם לפרוס מודל של צד שלישי ב- Vertex AI Model Garden או ב- self-host ב-GKE , ב-Cloud Run או ב-Compute Engine.
אוקיי, ברצונך ליצור טקסט. רוצה לכלול תמונות או סרטונים בהנחיות הטקסט? (מולטי-מודאלי)
פריסת מודל קוד פתוח ב: Vertex AI (Model Garden) GKE (HuggingFace)
עיגון ו-RAG
כדי להבטיח שהתשובות של המודל יהיו מושכלות ומדויקות, צריך להצמיד את אפליקציית ה-AI הגנרטיבי לנתונים בזמן אמת. התהליך הזה נקרא יצירה משולבת-אחזור (RAG).
אם רוצים ליצור תוכן שמבוסס על מידע עדכני מהאינטרנט, מודלים של Gemini יכולים להעריך אם הידע של המודל מספיק או אם נדרש עיגון באמצעות חיפוש Google.
אפשר להטמיע את ההארקה באמצעות אינדקס של הנתונים שלכם עם מנוע חיפוש. מנועי חיפוש רבים מאחסנים עכשיו הטמעות במסד נתונים וקטורי, שהוא פורמט אופטימלי לפעולות כמו חיפוש דמיון. Google Cloud מציעה פתרונות רבים של מסדי נתונים וקטוריים, לתרחישים שונים לדוגמה.
הערה: אפשר להשתמש בקרקוע באמצעות מסדי נתונים שאינם וקטוריים על ידי שליחת שאילתה למסד נתונים קיים כמו Cloud SQL או Firestore, ואפשר להשתמש בתוצאה של השאילתה בהנחיה של המודל.
האם אתם רוצים פתרון מנוהל לחלוטין שעבר אופטימיזציה, שתומך ברוב מקורות הנתונים ומונע גישה ישירה להטמעות הבסיסיות?
האם אתה רוצה לבנות מנוע חיפוש ל-RAG באמצעות כלי ניהול תהליכים עם ממשק שדומה ל-LlamaIndex?
האם אתם צריכים חיפוש וקטורי עם זמן אחזור קצר, הצגה בהיקף נרחב או מסד נתונים וקטורי מיוחד ומותאם?
האם הגישה לנתונים מתבצעת באופן פרוגרמטי (OLTP)? כבר משתמשים במסד נתונים של SQL?
רוצים להשתמש במודלים של AI מבית Google ישירות ממסד הנתונים שלכם? צריך זמן אחזור נמוך?
יש לכם מערך נתונים אנליטי גדול (OLAP)? נדרש עיבוד באצווה וגישה תכופה לטבלאות SQL על ידי בני אדם או סקריפטים (מדעי הנתונים)?
עיגון בעזרת ממשקי API
Vertex AI Extensions (גרסת Private Preview)
רכיבי LangChain
הארקה ב-Vertex AI
מתחילים לפתח
הגדרת סביבת הפיתוח ל-Google Cloud
הגדרת LangChain
LangChain הוא פריימוורק בקוד פתוח לאפליקציות AI גנרטיבי, שמאפשר לכם להוסיף הקשר להנחיות ולבצע פעולות על סמך התגובה של המודל.
הצגת דוגמאות קוד ופריסת אפליקציות לדוגמה
אפשר לעיין בדוגמאות קוד לתרחישי שימוש נפוצים ולפרוס דוגמאות של אפליקציות AI גנרטיביות שהן מאובטחות, יעילות, עמידות, בעלות ביצועים גבוהים וחסכוניות.