אתם יכולים להשתמש ב-Imagen ב-Vertex AI כדי להנחות את המודל איך להתאים אישית את הנושאים בתמונה ולשנות אותם לסגנון שאתם מציינים בהנחיית טקסט.
הצגת כרטיס המודל של Imagen לעריכה ולהתאמה אישית
כתיבת הנחיות להתאמה אישית
ההנחיה שבה אתם משתמשים בהתאמה אישית של Imagen 3 עשויה להשפיע על איכות התמונות שנוצרות. אפשר להיעזר בתבניות ההנחיות הבאות כנקודת התחלה לכתיבת הנחיות להתאמה אישית. יכול להיות שתצטרכו לשלוח כמה בקשות כדי לקבל את הפלט הרצוי.
| תרחיש לדוגמה | תמונות לדוגמה | תבנית הנחיה | דוגמה |
|---|---|---|---|
| התאמה אישית של הוראות – העברת סגנון | תמונה (1) | תשנה את subject in image [1] כך שיהיה לו סגנון של ${STYLE_DESCRIPTION}. התמונה מתארת ${IMAGE_DESCRIPTION}. | שנה את subject in image [1] לסגנון של ציור בצבעי מים של התמונה עם טכניקות חופשיות של צבעי מים, גוון רך, צבעי פסטל, משיכות מכחול, רקע עדין ונקי, ספונטניות, רישום בסגנון אנלוגי, ציור מורכב ומפורט מאוד. התמונה מציגה דיוקן של אישה גאה. |
התאמה אישית באמצעות התאמה אישית של הוראות להעברת סגנון
אפשר להשתמש בדוגמאות הקוד הבאות כדי לציין את הסגנון של התמונות שיופקו על סמך הסגנון שמתואר בהנחיית הטקסט.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- LOCATION: האזור של הפרויקט. לדוגמה,
us-central1,europe-west2אוasia-northeast3. רשימת האזורים הזמינים מופיעה במאמר מיקומים של AI גנרטיבי ב-Vertex AI. כשמשתמשים בנקודת קצה ל-API אזורית, האזור מכתובת ה-URL של נקודת הקצה קובע איפה הבקשה תעובד, והערךLOCATIONבנתיב המשאב מתעלם אם יש התנגשות. - TEXT_PROMPT: הנחיית הטקסט קובעת אילו תמונות המודל ייצור. כדי להשתמש בהתאמה אישית של Imagen 3, צריך לכלול את
referenceIdשל תמונה לדוגמה או התמונות שאתם מספקים בפורמט [$referenceId]. לדוגמה:- תשנה את הדמות בתמונה [1] כך שתהיה בסגנון של ויטראז' דיגיטלי סגנון תמונה.
- תוסיף לחתול בתמונה [1] כובע בוקרים אדום.
- תסיר את כלב הקורגי בתמונה [1].
- משנים את הכדור האדום בתמונה [1] לתיבה כחולה.
-
"referenceId": המזהה של התמונה לדוגמה, או המזהה של סדרה של תמונות לדוגמה שמתאימות לאותו נושא או סגנון. - BASE64_REFERENCE_IMAGE: תמונה לדוגמה להנחיית יצירת תמונות. צריך לציין את התמונה כמחרוזת בייטים בקידוד Base64.
- IMAGE_COUNT: מספר התמונות שנוצרו. ערכים קבילים מסוג מספר שלם: 1-4. ערך ברירת המחדל: 4.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
גוף בקשת JSON:
{
"instances": [
{
"prompt": "TEXT_PROMPT",
"referenceImages": [
{
"referenceType": "REFERENCE_TYPE_RAW",
"referenceId": 1,
"referenceImage": {
"bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
}
}
]
}
],
"parameters": {
"sampleCount": IMAGE_COUNT
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2. התגובה מחזירה שני אובייקטים של חיזוי, עם בייטים של התמונה שנוצרה בקידוד Base64.
{
"predictions": [
{
"bytesBase64Encoded": "BASE64_IMG_BYTES",
"mimeType": "image/png"
},
{
"mimeType": "image/png",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
}
]
}
שימוש במוצרים
כדי לראות את תקני השימוש והגבלות התוכן שקשורים ל-Imagen ב-Vertex AI, אפשר לעיין בהנחיות השימוש.
גרסאות המודלים
יש כמה מודלים ליצירת תמונות שבהם אפשר להשתמש. מידע נוסף זמין במאמר בנושא מודלים של Imagen.
המאמרים הבאים
מאמרים על Imagen ועל מוצרים אחרים של AI גנרטיבי ב-Vertex AI:
- מדריך למפתחים לתחילת העבודה עם Imagen 3 ב-Vertex AI
- מודלים וכלים חדשים של מדיה גנרטיבית, שנוצרו עם יוצרים ועבור יוצרים
- חדש ב-Gemini: תצורות Gem בהתאמה אישית ויצירת תמונות משופרת באמצעות Imagen 3
- Google DeepMind: Imagen 3 – המודל האיכותי ביותר שלנו ליצירת תמונות לפי טקסט