‫AI גנרטיבי

תיעוד ומשאבים לפיתוח וליישום של אפליקציות AI גנרטיביות באמצעות כלים ומוצרים של Google Cloud .

  • פיתוח באמצעות המודלים והכלים הכי עדכניים שלנו ל-AI גנרטיבי
  • שימוש בחינם ביותר מ-20 מוצרים פופולריים, כולל Compute Engine וממשקי API של AI
  • בלי חיובים אוטומטיים ובלי התחייבות

מתנסים ביותר מ-20 מוצרים שבחינם תמיד

תוכלו להשתמש ביותר מ-20 מוצרים בחינם לתרחישי שימוש נפוצים, כולל ממשקי API של AI, מכונות וירטואליות, מחסני נתונים (data warehouse) ועוד.

מידע על פיתוח אפליקציות AI גנרטיבי

גישה למודלים גדולים של AI גנרטיבי מבית Google, כדי שתוכלו לבדוק, לכוונן ולפרוס אותם לשימוש באפליקציות מבוססות-AI.
כדאי לכם לנסות לשלוח בקשות ל-Gemini API דרך פלטפורמת ה-AI-ML של Google Cloud, ‏ Vertex AI.
אתם יכולים להשתמש בעוצמה של GKE כפלטפורמת AI/ML שניתנת להתאמה אישית, עם ביצועים גבוהים, אירוח והדרכה משתלמים, יכולת התאמה מובילה בתעשייה ואפשרויות גמישות לתשתית.
לזהות אם AI גנרטיבי, AI מסורתי או שילוב של שניהם מתאימים לתרחיש השימוש העסקי שלכם.
במאמר הזה מוסבר איך להתמודד עם האתגרים בכל שלב בפיתוח של אפליקציית AI גנרטיבי.
אפשר לעיין בדוגמאות קוד לתרחישי שימוש נפוצים ולפרוס דוגמאות של אפליקציות AI גנרטיביות שהן מאובטחות, יעילות, עמידות, מניבות ביצועים טובים ומשתלמות.
מידע על מונחים ספציפיים שקשורים ל-AI גנרטיבי.

כלים מבוססי-AI גנרטיבי

רשימה של כלים מבוססי-AI גנרטיבי, כולל Vertex AI Studio,‏ Colab Enterprise/Notebooks ו-Workbench, שמופיעים במסוף Cloud, ו-SDK/APIs שמופיעים כפריט נפרד.

תהליך הפיתוח של AI גנרטיבי

תרשים של תהליך הפיתוח של AI גנרטיבי עם שישה שלבים: בחירת מודל (כולל Model Garden), הנדסת הנחיות (כולל גלריית הנחיות, Vertex AI Studio, השוואת הנחיות ואופטימיזציה של הנחיות), כוונון (כולל אימון וכוונון), אופטימיזציה (כולל זיקוק), פריסה (כולל מרשם המודלים, תחזית אונליין ותחזית באצווה) ומעקב. שלבי בחירת המודל, הנדסת ההנחיות, הכוונון והאופטימיזציה הם חלק ממחזור משנה חוזר שנקרא הערכה.

אירוח וניתוח של מודלים

‫Google Cloud מספקת קבוצה של מודלים בסיסיים חדשניים דרך Vertex AI, כולל Gemini. אפשר גם לפרוס מודל של צד שלישי ב-Vertex AI Model Garden או לארח אותו ב-GKE או ב-Compute Engine.

אפשר לגלות, לבדוק, להתאים אישית ולפרוס מודלים ונכסים של Google מתוך ספריית מודלים של למידת מכונה.
גילוי, בדיקה, התאמה אישית ופריסה של נכסים ומודלים נבחרים של OSS מספריית מודלים של ML.
בקורס הזה תלמדו איך לפרוס מודלים של HuggingFace ליצירת טקסט ב-Vertex AI או ב-Google Kubernetes Engine‏ (GKE).
אפשר לצרף יחידות GPU למכונות וירטואליות כדי להאיץ עומסי עבודה של AI גנרטיבי ב-Compute Engine.

עיצוב והנדסה של הנחיות

עיצוב הנחיות הוא תהליך של יצירת צמדים של הנחיות ותשובות כדי לספק למודלים של שפה הקשר והוראות נוספים. אחרי שכותבים הנחיות, מזינים אותן למודל כמערך נתונים של הנחיות לצורך אימון מראש. כשמודל מציג תחזיות, הוא מגיב עם ההוראות שלכם.

עיצוב, בדיקה והתאמה אישית של ההנחיות שנשלחות למודלים הגדולים של שפה (LLM) Gemini ו-PaLM 2 של Google.
כאן מוסבר על תהליך העבודה של הנדסת הנחיות ועל אסטרטגיות נפוצות שאפשר להשתמש בהן כדי להשפיע על התשובות של המודל.
דוגמאות להנחיות ולתשובות לתרחישי שימוש ספציפיים.

עיגון ו-RAG

הארקה מקשרת מודלים של AI למקורות נתונים כדי לשפר את דיוק התשובות ולהפחית את ההזיות. ‫RAG היא טכניקה נפוצה להארקה. היא מחפשת מידע רלוונטי ומוסיפה אותו להנחיה של המודל, כדי להבטיח שהפלט יתבסס על עובדות ועל מידע עדכני.

אפשר להשתמש בחיפוש Google או בנתונים שלכם שמאוחסנים בחיפוש מבוסס-Vertex AI כדי להקנות למודלים של Vertex AI ידע על העולם.
אפשר להשתמש בהארקה עם חיפוש Google כדי לקשר את המודל לידע העדכני שזמין באינטרנט.
אפשר להשתמש ב-AlloyDB כדי ליצור ולאחסן הטבעות וקטוריות, ואז ליצור אינדקס להטבעות ולהריץ עליהן שאילתות באמצעות התוסף pgvector.
אחסון הטמעות וקטוריות ב-Postgres SQL, ואז יצירת אינדקס והפעלת שאילתות על ההטמעות באמצעות התוסף pgvector.
אפשר להשתמש ב-LangChain כדי לחלץ נתונים מ-BigQuery, להעשיר את התשובות של המודל ולבסס אותן על נתונים.
ליצור הטבעות וקטוריות מהנתונים ב-Firestore, ואז ליצור אינדקס להטבעות ולהריץ עליהן שאילתות.
אפשר להשתמש ב-LangChain כדי לחלץ נתונים מ-Memorystore, להוסיף הקשר לתשובות של המודל ולשפר אותן.

סוכנים ובקשות להפעלת פונקציות

סוכנים מאפשרים לעצב ולשלב בקלות ממשק משתמש צ'אט עם AI באפליקציה לנייד, בעוד שקריאה לפונקציות מרחיבה את היכולות של מודל.

אפשר להשתמש במודלי הבסיס של Google, במומחיות שלה בחיפוש ובטכנולוגיות ה-AI בממשק שיחה כדי ליצור אפליקציות AI גנרטיבי ברמת הארגון.
מוסיפים למודל קריאה לפונקציה כדי לאפשר פעולות כמו הזמנת מקום על סמך מידע שחולץ מהיומן.

התאמה אישית של מודלים ואימון שלהם

משימות מיוחדות, כמו אימון מודל שפה בטרמינולוגיה ספציפית, עשויות לדרוש יותר אימון ממה שאפשר לעשות רק באמצעות עיצוב הנחיות או ביסוס. במקרה כזה, אפשר להשתמש בכוונון מודלים כדי לשפר את הביצועים, או לאמן מודל משלכם.

הערכת הביצועים של מודלים בסיסיים ומודלים של בינה מלאכותית גנרטיבית שעברו כוונון ב-Vertex AI.
אפשר לבצע התאמה של מודלים בסיסיים למטרות כלליות כדי לשפר את הביצועים שלהם במשימות ספציפיות.
יחידות TPU הן מעגלים משולבים לאפליקציות ספציפיות (ASIC) שפותחו על ידי Google כדי לעזור להאיץ עומסי עבודה של למידת מכונה, כמו אימון של מודל שפה גדול (LLM).

אני רוצה להתחיל לפתח

‫LangChain הוא פריימוורק בקוד פתוח לאפליקציות AI גנרטיבי, שמאפשר לכם להוסיף הקשר להנחיות ולבצע פעולות על סמך התגובה של המודל.
אפשר לעיין בדוגמאות קוד לתרחישי שימוש נפוצים ולפרוס דוגמאות של אפליקציות AI גנרטיביות שהן מאובטחות, יעילות, עמידות, בעלות ביצועים גבוהים וחסכוניות.