בחירת מודלים ותשתית לאפליקציית ה-AI הגנרטיבי

לומדים אילו מוצרים, מסגרות וכלים הם המתאימים ביותר לבניית אפליקציית AI גנרטיבי. באיור הבא מוצגים רכיבים נפוצים ביישום של AI גנרטיבי שמתארח בענן.
דיאגרמת ון שמציגה את הרכיבים של מערכת AI גנרטיבי דיאגרמת ון שמציגה את הרכיבים של מערכת AI גנרטיבי
  1. אירוח אפליקציות: מחשוב לאירוח האפליקציה. האפליקציה יכולה להשתמש בספריות הלקוח ובערכות ה-SDK של Google Cloud כדי לתקשר עם מוצרי Cloud שונים.

  2. אירוח מודלים: אירוח מאובטח וניתן להרחבה של מודל גנרטיבי.

  3. מודל: מודל גנרטיבי לטקסט, לצ'אט, לתמונות, לקוד, להטמעות ולמולטימודל.

  4. פתרון להארקה: עיגון הפלט של המודל למקורות מידע שניתן לאמת ומתעדכנים.

  5. מסד נתונים: אחסון הנתונים של האפליקציה. יכול להיות שתשתמשו מחדש במסד הנתונים הקיים כפתרון להארקה, על ידי הגדלת ההנחיות באמצעות שאילתת SQL, ו/או אחסון הנתונים כהטמעות וקטוריות באמצעות תוסף כמו pgvector.

  6. אחסון: אחסון קבצים כמו תמונות, סרטונים או חזיתות סטטיות של אתרים. יכול להיות שתשתמשו ב-Storage גם בשביל נתוני ההארקה הגולמיים (למשל, קובצי PDF) שבהמשך ממירים להטמעות ומאחסנים במסד נתונים וקטורי.

בקטעים הבאים מפורטים כל אחד מהרכיבים האלה, כדי לעזור לכם לבחור אילו מוצרי Google Cloud כדאי לכם לנסות.

תשתית לאירוח אפליקציות

בוחרים מוצר לאירוח ולשירות של עומס העבודה של האפליקציה, ששולחת קריאות למודל הגנרטיבי.

רוצים תשתית מנוהלת ללא שרת?

סגירה
check
Cloud Run
סגירה

האם אפשר להכניס את האפליקציה שלך לקונטיינר?

סגירה
check
Kubernetes Engine
סגירה

תשתית לאירוח מודלים

‫Google Cloud מספקת כמה דרכים לאירוח מודל גנרטיבי, החל מפלטפורמת הדגל Vertex AI, ועד לאירוח שניתן להתאמה ולהעברה ב-Google Kubernetes Engine.

אתם משתמשים ב-Gemini וצריכים תכונות לארגונים כמו יכולת הרחבה, אבטחה, פרטיות נתונים ויכולת מעקב

check
סגירה
Gemini Developer API
check

רוצים תשתית מנוהלת מלאה עם ממשקי API וכלים גנרטיביים ממעלה ראשונה של AI?

סגירה
check
Vertex AI
סגירה

האם המודל שלכם דורש ליבת מערכת הפעלה (kernel) מיוחדת, מערכת הפעלה מדור קודם או תנאי רישוי מיוחדים?

סגירה
check
Compute Engine
סגירה

דגם

‫Google Cloud מספקת סדרה של מודלים בסיסיים חדשניים דרך Vertex AI , כולל Gemini. אפשר גם לפרוס מודל של צד שלישי ב- Vertex AI Model Garden או ב- self-host ב-GKE , ב-Cloud Run או ב-Compute Engine.

האם ליצור קוד?

סגירה
check
Codey (Vertex AI)
סגירה

רוצה שאצור תמונות?

סגירה
check
Imagen (Vertex AI)
סגירה

רוצים ליצור הטמעות לחיפוש, לסיווג או לאשכול?

סגירה
check
text-embedding (Vertex AI)
סגירה

אוקיי, ברצונך ליצור טקסט. רוצה לכלול תמונות או סרטונים בהנחיות הטקסט? (מולטי-מודאלי)

סגירה
check
Gemini (Vertex AI)
סגירה

אוקיי, רק הנחיות טקסט. רוצים להשתמש במודל הדגל הכי מתקדם של Google?

סגירה
check
Gemini (Vertex AI)
סגירה

עיגון ו-RAG

כדי להבטיח שהתשובות של המודל יהיו מושכלות ומדויקות, צריך להצמיד את אפליקציית ה-AI הגנרטיבי לנתונים בזמן אמת. התהליך הזה נקרא יצירה משולבת-אחזור (RAG).

אם רוצים ליצור תוכן שמבוסס על מידע עדכני מהאינטרנט, מודלים של Gemini יכולים להעריך אם הידע של המודל מספיק או אם נדרש עיגון באמצעות חיפוש Google.

אפשר להטמיע את ההארקה באמצעות אינדקס של הנתונים שלכם עם מנוע חיפוש. מנועי חיפוש רבים מאחסנים עכשיו הטמעות במסד נתונים וקטורי, שהוא פורמט אופטימלי לפעולות כמו חיפוש דמיון. Google Cloud מציעה פתרונות רבים של מסדי נתונים וקטוריים, לתרחישים שונים לדוגמה.

הערה: אפשר להשתמש בקרקוע באמצעות מסדי נתונים שאינם וקטוריים על ידי שליחת שאילתה למסד נתונים קיים כמו Cloud SQL או Firestore, ואפשר להשתמש בתוצאה של השאילתה בהנחיה של המודל.

האם אתם רוצים פתרון מנוהל לחלוטין שעבר אופטימיזציה, שתומך ברוב מקורות הנתונים ומונע גישה ישירה להטמעות הבסיסיות?

סגירה
check
Vertex AI Search
סגירה
אתם בונים מנוע חיפוש ל-RAG

האם אתה רוצה לבנות מנוע חיפוש ל-RAG באמצעות כלי ניהול תהליכים עם ממשק שדומה ל-LlamaIndex?

סגירה
check
Vertex AI RAG Engine
סגירה
אפשר להשתמש בארכיטקטורת הפניה כדי לבנות מנוע חיפוש בהתאמה אישית ומסד נתונים וקטורי לתרחישי שימוש ב-RAG.
סגירה

האם אתם צריכים חיפוש וקטורי עם זמן אחזור קצר, הצגה בהיקף נרחב או מסד נתונים וקטורי מיוחד ומותאם?

סגירה
check
Vertex AI Vector Search
סגירה

האם הגישה לנתונים מתבצעת באופן פרוגרמטי (OLTP)? כבר משתמשים במסד נתונים של SQL?

סגירה
check

רוצים להשתמש במודלים של AI מבית Google ישירות ממסד הנתונים שלכם? צריך זמן אחזור נמוך?

check
סגירה
סגירה

יש לכם מערך נתונים אנליטי גדול (OLAP)? נדרש עיבוד באצווה וגישה תכופה לטבלאות SQL על ידי בני אדם או סקריפטים (מדעי הנתונים)?

check
BigQuery

עיגון בעזרת ממשקי API

במקום להשתמש בנתונים שלכם כדי להצמיד את המודל לקרקע (או בנוסף לשימוש בנתונים שלכם), שירותים מקוונים רבים מציעים ממשקי API שבהם אפשר להשתמש כדי לאחזר נתונים להצמדה לקרקע, וכך לשפר את ההנחיה למודל.
יצירה, פריסה וניהול של תוספים שמקשרים מודלים גדולים של שפה לממשקי API של מערכות חיצוניות.
אפשר לעיין במגוון טועני מסמכים ושילובים של ממשקי API לאפליקציות AI גנרטיביות, מ-YouTube ועד Google Scholar.
אם אתם משתמשים במודלים שמתארחים ב-Vertex AI, אתם יכולים להשתמש בחיפוש מבוסס-Vertex AI, בחיפוש Google או בטקסט מוטבע או בטקסט בקובץ כדי להקפיד שהתשובות של המודל יתבססו על נתונים מהימנים.

מתחילים לפתח

‫LangChain הוא פריימוורק בקוד פתוח לאפליקציות AI גנרטיבי, שמאפשר לכם להוסיף הקשר להנחיות ולבצע פעולות על סמך התגובה של המודל.

אפשר לעיין בדוגמאות קוד לתרחישי שימוש נפוצים ולפרוס דוגמאות של אפליקציות AI גנרטיביות שהן מאובטחות, יעילות, עמידות, בעלות ביצועים גבוהים וחסכוניות.