במאמר הזה נסביר איך לתכנן ולעצב את תשתית המחשוב באמצעות הנחיות ל-Gemini.
אתם יכולים להשתמש ב-Gemini במסוף Google Cloud כממשק מבוסס-AI כדי להעריך אפשרויות חומרה, להעריך את עלויות הפריסה ולראות המלצות להגדרות של מכונות וירטואליות ב-Compute Engine. כדי להתאים את ההמלצות, Gemini בודק את הפרויקט שלכם לפי מגבלות המכסה, ההזמנות הקיימות, ההנחות תמורת התחייבות לשימוש (CUD), האזור ואזור הזמינות שמוגדרים כברירת מחדל וההגבלות על מיקום המשאבים. Google Cloud בעזרת Gemini, תוכלו לתכנן את ההגדרות האופטימליות לעומס העבודה שלכם לפני שתיצרו או תשנו מכונת חישוב.
מידע נוסף על הרכיבים שצריך להגדיר לפני שיוצרים מכונת חישוב או במהלך היצירה שלה זמין במאמר סקירה כללית של יצירת מכונות Compute Engine.
מגבלות
כשמזינים הנחיה ל-Gemini במסוף Google Cloud , אי אפשר ליצור, לשנות או למחוק משאבים באמצעות Gemini.
לפני שמתחילים
כשמשתמשים במסוף Google Cloud כדי לגשת לשירותים Google Cloud ולממשקי API, לא צריך להגדיר אימות.
התפקידים הנדרשים
כדי לקבל את ההרשאות שנדרשות לגישה ל-Gemini ולשימוש בו, צריך לבקש מהאדמין להקצות לכם את תפקיד ה-IAM Compute Viewer (roles/compute.viewer) בפרויקט.
כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות כדי לגשת ל-Gemini ולתת לו הנחיות. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי לגשת ל-Gemini ולתת לו הנחיות, צריך את ההרשאות הבאות:
-
כדי לראות רשימה של מופעים:
compute.instances.list
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
גישה ל-Gemini במסוף Google Cloud
כדי לגשת אל Gemini במסוף Google Cloud :
במסוף Google Cloud , נכנסים לדף Overview.
בקטע עיצוב התשתית באמצעות Compute Advisor, אפשר לראות את הפרטים הבאים:
רכיבי ממשק המשתמש שמוצגים בצילום המסך שלמעלה הם:
כרטיסי הנחיות לפעולה מהירה: קבוצה של כרטיסים שכל אחד מהם מכיל הנחיה לדוגמה. אם לוחצים על כרטיס, Google Cloud ההנחיה לדוגמה מאוכלסת אוטומטית בתיבת ההנחיה.
תיבת הנחיה: בשדה הזה אפשר להזין ולשלוח הנחיות. כדי לשלוח הנחיה, לוחצים על שליחת הנחיה.
הצגת שיחות קודמות: התכונה הזו מאפשרת לכם לראות את הפרטים של שיחה קודמת ולהמשיך אותה, או למחוק שיחות אם הן כבר לא נחוצות לכם.
הנחיה ל-Gemini
אחרי ששולחים הנחיה, Gemini מתחיל ליצור תשובה. יופיע חלונית ובמסוף Google Cloud תוצג התשובה להנחיה בחלונית, כמו בצילום המסך הבא:
בהתאם להנחיה, חלונית התגובה כוללת את הרכיבים הבאים:
התבססות על הקשר: Gemini מעריך באופן אוטומטי את ההקשר של הפרויקט כדי לספק המלצות מותאמות אישית, כולל מגבלות מכסת השימוש, הזמנות קיימות, הנחות על שימוש מתמשך, האזור ואזור הזמינות שמוגדרים כברירת מחדל ומגבלות על מיקום המשאבים.
קטעי קוד אינטראקטיביים: Gemini יוצר פקודות gcloud, רכיבי method של API בארכיטקטורת REST או משאבי Terraform. אפשר להעתיק ולהדביק את קטעי הקוד האלה או להריץ אותם ב-Cloud Shell.
לוח ויזואלי: Gemini מארגן את ההמלצות בטבלאות מובנות ובהשוואות זו לצד זו. התצוגה הזו עוזרת לכם להעריך את תכונות המוצר ואת הגישות הארכיטקטוניות. הוא גם מספק תוכנית הטמעה לתרחיש השימוש שלכם.
בקטעים הבאים מפורטות שיטות מומלצות לכתיבת הנחיות, ומוצגות הנחיות לדוגמה שאפשר להשתמש בהן לפני שיוצרים או משנים מכונת חישוב.
שיטות מומלצות לכתיבת הנחיות
כדי לקבל מ-Gemini המלצות מדויקות ושימושיות, מומלץ להנחות אותו באותו אופן שבו יוצרים בלוק קוד. הגישה הזו מנחה את ה-AI הגנרטיבי באמצעות הצהרות ברורות על פרמטרים, הגדרות תפקידים, הוראות ספציפיות ופורמטים ברורים של פלט.
כשמנסחים הנחיות ל-Gemini, כדאי לפעול לפי השיטות המומלצות הבאות:
מתמקדים בתכנון ובעיצוב: אנחנו ממליצים לא להנחות את Gemini לפתור בעיות בשגיאות של מופע מחשוב. כדי לפתור את השגיאות האלה, אפשר לעיין במאמר פתרון בעיות ביצירה, בעדכון ובמחיקה של מכונות וירטואליות.
מציינים תפקיד או פרסונה: מגדירים תפקיד או פרסונה ש-Gemini צריך לאמץ, כמו אדמין IT, חוקר AI או מהנדס פלטפורמה. הגישה הזו מכתיבה את הטון, העומק ורמת המומחיות של ההמלצות שמתקבלות.
נותנים הוראות מפורטות וממוספרות: מפרקים את המטרה לשאלות או למשימות קונקרטיות ומפורטות. הגישה הזו מארגנת את תהליך החשיבה של Gemini ועוזרת לו לוודא שהוא עונה על כל הדרישות שלכם.
הגדרת פורמט פלט ספציפי: מציינים במפורש איך רוצים שההמלצה תעוצב, למשל הסבר מפורט, טבלת השוואה ב-Markdown או בלוק קוד gcloud מוכן לשימוש.
שימוש בהארקה אוטומטית של ההקשר: לא צריך לכלול בהנחיה את אזור ברירת המחדל, המכסות הזמינות, הנחות השימוש המחייב או מגבלות על מיקום המשאבים. Gemini יכול לגשת למידע הזה בפרויקט Google Cloud .
שיפור העיצובים באופן איטרטיבי: אתם יכולים לשנות או להרחיב את התשובה ש-Gemini יצר על ידי שליחת הנחיות חדשות. לדוגמה, אתם יכולים לבקש מהעוזר הדיגיטלי להוסיף המלצות לגבי רשת לתוכנית הפריסה שלכם או לשנות את דרישות האחסון בלי להתחיל שיחה חדשה.
הנחיות לדוגמה
הנה כמה דוגמאות להנחיות שבהן אפשר להשתמש כדי לתכנן ולבצע אופטימיזציה של תשתית המחשוב:
טופולוגיה של מכונת מחשוב ואסטרטגיית מיקום: כדי לקבוע את מודל הפריסה האופטימלי ואת מדיניות המיקום של עומס עבודה עם זמינות גבוהה, אפשר להשתמש בהנחיה כמו הבאה:
Act as a cloud architect. I need to design a compute instance topology for a distributed database that balances multi-zone resilience with sub-millisecond latency. Please provide the following: 1. A side-by-side comparison of regional MIGs against zonal MIGs. 2. An explanation of whether compact placement policies work regionally. 3. The optimal autoscaling configuration for this workload. Format the comparison as a Markdown table, and provide the deployment steps as ready-to-use gcloud code blocks.מודל הקצאת משאבים ואופטימיזציה של עלויות: כדי להעריך מודלים של הקצאת משאבים ולצמצם את העלויות של עיבוד ברצף (batch processing), אפשר להשתמש בהנחיה כמו הבאה:
Act as a platform engineer. I need to find the cheapest way to run large, interruptible analytics jobs on our cloud servers without risking data loss. Please provide the following: 1. A cost and reliability comparison of standard discounted servers against queue-based servers. 2. An explanation of how to boot all our compute power at the exact same time. 3. A deployment script that gives our jobs a two-minute warning before a server gets reclaimed. Format the comparison as a Markdown table, and provide the script as a ready-to-use code block.