איך יוצרים תמונות (Vertex AI Studio)
בדף הזה מוסבר איך אפשר להגדיר פרמטר אופציונלי של Imagen ב-Vertex AI כדי לציין את שפת ההנחיה שבה אתם משתמשים. אם לא מציינים שפה, Imagen מזהה את השפה באופן אוטומטי.
1 A pile of books seen from above. הספר העליון מכיל איור בצבעי מים של ציפור. VERTEX AI כתוב באותיות מודגשות על הספר. |
2 Woman wearing bright colors, in the style of dark yellow and dark cyan, wearing earrings, postmodern fashion photography. |
הגדרת השפה של הנחיית הטקסט
אלה ערכי הקלט הנתמכים לשפת ההנחיה הטקסטואלית:
- סינית (פשוטה) (
zh/zh-CN) - סינית (מסורתית) (
zh-TW) - אנגלית (
en, ערך ברירת מחדל) - צרפתית (
fr) - גרמנית (
de) - הינדי (
hi) - יפנית (
ja) - קוריאנית (
ko) - פורטוגזית (
pt) ספרדית (
es)
המסוף
אם ההנחיה שלכם היא באחת מהשפות הנתמכות, מודל Imagen מזהה ומתרגם את הטקסט ומחזיר את התמונות שנוצרו או נערכו.
אם ההנחיה שלכם היא בשפה שלא נתמכת, Imagen משתמש בטקסט כלשונו לבקשה. יכול להיות שהפלט יהיה לא צפוי.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- TEXT_PROMPT: הנחיית טקסט שמנחה את המודל לגבי התמונות שהוא יוצר. חובה למלא את השדה הזה גם כשיוצרים וגם כשעורכים.
- PROMPT_LANGUAGE: מחרוזת. זה שינוי אופציונלי. קוד השפה שמתאים לשפה של הנחיית הטקסט.
בדוגמה הזו, זה יהיה
hi. ערכים זמינים:-
auto– זיהוי אוטומטי. אם Imagen מזהה שפה נתמכת, ההנחיה (ובאופן אופציונלי, הנחיה שלילית) מתורגמת לאנגלית. אם השפה שזוהתה לא נתמכת, Imagen משתמש בטקסט הקלט כלשונו, ולכן יכול להיות שהפלט יהיה לא צפוי. לא מוחזר קוד שגיאה. -
en– אנגלית (ערך ברירת המחדל אם לא מציינים שפה) -
es– ספרדית -
hi– הינדית ja– יפנית-
ko– קוריאנית -
pt– פורטוגזית -
zh-TW- סינית (מסורתית) -
zhאוzh-CN– סינית (פשוטה)
-
ה-method של ה-HTTP וכתובת ה-URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict
גוף בקשת JSON:
{
"instances": [
{
"prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
}
],
"parameters": {
"language": "PROMPT_LANGUAGE"
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content
"sampleCount": 2. התגובה מחזירה שני אובייקטים של חיזוי, עם בייטים של התמונה שנוצרה בקידוד Base64.
{
"predictions": [
{
"bytesBase64Encoded": "BASE64_IMG_BYTES",
"mimeType": "image/png"
},
{
"mimeType": "image/png",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
}
]
}
המאמרים הבאים
- שימוש בכלי לשכתוב הנחיות
- הגדרת יחס גובה-רוחב
- השמטת תוכן באמצעות הנחיה שלילית
- יצירת תמונות דטרמיניסטיות