אתם יכולים להשתמש ב-Imagen ב-Vertex AI כדי להנחות את המודל איך להתאים אישית את הנושאים בתמונה ולשנות אותם לסגנון שאתם מציינים בהנחייה טקסטואלית.
המודלים הבאים תומכים בהתאמה אישית של הוראות:
הצגת כרטיס המודל של Imagen לעריכה ולהתאמה אישית
כתיבת הנחיות להתאמה אישית
ההנחיה שבה אתם משתמשים בהתאמה אישית של Imagen 3 עשויה להשפיע על איכות התמונות שנוצרות. אפשר להשתמש בתבניות ההנחיות הבאות כנקודת התחלה לכתיבת הנחיות להתאמה אישית. יכול להיות שתצטרכו לשלוח כמה בקשות כדי לקבל את הפלט הרצוי.
| תרחיש שימוש | תמונות לדוגמה | תבנית הנחיה | דוגמה |
|---|---|---|---|
| התאמה אישית של הוראות – העברת סגנון | תמונה (1) | תשנה את subject in image [1] כך שיהיה לו סגנון של ${STYLE_DESCRIPTION}. בתמונה מוצג ${IMAGE_DESCRIPTION}. | תשנה את התמונה subject in image [1] לסגנון של ציור בצבעי מים עם טכניקות חופשיות של צבעי מים, גוון רך, צבעי פסטל, משיכות מכחול, רקע עדין ונקי, ספונטניות, ציור בסגנון אנלוגי וציור מורכב ומפורט. התמונה מתארת דיוקן של אישה גאה. |
התאמה אישית באמצעות התאמה אישית של הוראות להעברת סגנון
אפשר להשתמש בדוגמאות הקוד הבאות כדי לציין את הסגנון של תמונות הפלט על סמך הסגנון שמתואר בהנחיית הטקסט.
REST
מידע נוסף על Imagen API:
- Method:
endpoints.predict VisionGenerativeModelInstanceVisionGenerativeModelParamsVisionGenerativeModelResult
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- LOCATION: האזור של הפרויקט. לדוגמה,
us-central1,europe-west2אוasia-northeast3. רשימת האזורים הזמינים מופיעה במאמר מיקומי AI גנרטיבי ב-Vertex AI. כשמשתמשים בנקודת קצה אזורית של API, האזור מכתובת ה-URL של נקודת הקצה קובע איפה הבקשה תעובד, והערךLOCATIONבנתיב המשאב מתעלם אם יש התנגשות. - TEXT_PROMPT: הנחייה טקסטואלית קובעת אילו תמונות המודל יוצר. כדי להשתמש בהתאמה אישית של Imagen 3, צריך לכלול את
referenceIdשל תמונת הדוגמה או התמונות שאתם מספקים בפורמט [$referenceId]. לדוגמה:- תשנה את הדמות בתמונה [1] לסגנון של ויטראז' דיגיטלי.
- תוסיף לחתול בתמונה [1] כובע בוקרים אדום.
- תסיר את כלב הקורגי בתמונה [1].
- תשנה את הכדור האדום בתמונה [1] לקובייה כחולה.
-
"referenceId": המזהה של התמונה לדוגמה, או המזהה של סדרה של תמונות לדוגמה שמתאימות לאותו נושא או סגנון. - BASE64_REFERENCE_IMAGE: תמונה לדוגמה שתשמש להנחיית יצירת תמונות. צריך לציין את התמונה כמחרוזת בייטים בקידוד base64.
- IMAGE_COUNT: מספר התמונות שנוצרו. ערכים קבילים מסוג מספר שלם: 1-4. ערך ברירת המחדל: 4.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
גוף בקשת JSON:
{
"instances": [
{
"prompt": "TEXT_PROMPT",
"referenceImages": [
{
"referenceType": "REFERENCE_TYPE_RAW",
"referenceId": 1,
"referenceImage": {
"bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
}
}
]
}
],
"parameters": {
"sampleCount": IMAGE_COUNT
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2. התגובה מחזירה שני אובייקטים של חיזוי, עם בייטים של התמונה שנוצרה בקידוד Base64.
{
"predictions": [
{
"bytesBase64Encoded": "BASE64_IMG_BYTES",
"mimeType": "image/png"
},
{
"mimeType": "image/png",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
}
]
}
שימוש במוצר
כדי לראות את תקני השימוש והגבלות התוכן שקשורים ל-Imagen ב-Vertex AI, אפשר לעיין בהנחיות השימוש.
גרסאות המודלים
יש כמה מודלים ליצירת תמונות שבהם אפשר להשתמש. מידע נוסף זמין במאמר בנושא מודלים של Imagen.
המאמרים הבאים
כדאי לקרוא מאמרים על Imagen ועל מוצרים אחרים של AI גנרטיבי ב-Vertex AI:
- מדריך למפתחים לתחילת העבודה עם Imagen 3 ב-Vertex AI
- מודלים וכלים חדשים של מדיה גנרטיבית, שנוצרו עם יוצרים ועבור יוצרים
- חדש ב-Gemini: תצורות Gem מותאמות אישית ויצירת תמונות משופרת באמצעות Imagen 3
- Google DeepMind: Imagen 3 – המודל האיכותי ביותר שלנו ליצירת תמונות לפי טקסט