הגדרת השפה של הנחיית הטקסט

איך יוצרים תמונות (Vertex AI Studio)

ניסיון של Imagen ב-Colab

בדף הזה מוסבר איך אפשר להגדיר פרמטר אופציונלי של Imagen ב-Vertex AI כדי לציין את שפת ההנחיה שבה אתם משתמשים. אם לא מציינים שפה, Imagen מזהה את השפה באופן אוטומטי.

תמונה של ספר שנוצרה מהנחיה בהינדית
Image generated from prompt: ऊपर से देखा गया किताबों का ढेर। सबसे ऊपरी पुस्तक में एक पक्षी का जलरंग चित्रण है। किताब पर VERTEX AI मोटे अक्षरों में लिखा हुआ है 1

1 A pile of books seen from above. הספר העליון מכיל איור בצבעי מים של ציפור. ‫VERTEX AI כתוב באותיות מודגשות על הספר.
תמונה של אישה מהנחיה בקוריאנית
Image generated from prompt: 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고있는 여자 포스트 모던 패션 사진 2

2 Woman wearing bright colors, in the style of dark yellow and dark cyan, wearing earrings, postmodern fashion photography.

הגדרת השפה של הנחיית הטקסט

אלה ערכי הקלט הנתמכים לשפת ההנחיה הטקסטואלית:

  • סינית (פשוטה) (zh/zh-CN)
  • סינית (מסורתית) (zh-TW)
  • אנגלית (en, ערך ברירת מחדל)
  • צרפתית (fr)
  • גרמנית (de)
  • הינדי (hi)
  • יפנית (ja)
  • קוריאנית (ko)
  • פורטוגזית (pt)
  • ספרדית (es)

המסוף

אם ההנחיה שלכם היא באחת מהשפות הנתמכות, מודל Imagen מזהה ומתרגם את הטקסט ומחזיר את התמונות שנוצרו או נערכו.

אם ההנחיה שלכם היא בשפה שלא נתמכת, Imagen משתמש בטקסט כלשונו לבקשה. יכול להיות שהפלט יהיה לא צפוי.

REST

לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:

  • PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
  • TEXT_PROMPT: הנחיית טקסט שמנחה את המודל לגבי התמונות שהוא יוצר. חובה למלא את השדה הזה גם כשיוצרים וגם כשעורכים.
  • PROMPT_LANGUAGE: מחרוזת. זה שינוי אופציונלי. קוד השפה שמתאים לשפה של הנחיית הטקסט. בדוגמה הזו, זה יהיה hi. ערכים זמינים:
    • auto – זיהוי אוטומטי. אם Imagen מזהה שפה נתמכת, ההנחיה (ובאופן אופציונלי, הנחיה שלילית) מתורגמת לאנגלית. אם השפה שזוהתה לא נתמכת, ‫Imagen משתמש בטקסט הקלט כלשונו, ולכן יכול להיות שהפלט יהיה לא צפוי. לא מוחזר קוד שגיאה.
    • en – אנגלית (ערך ברירת המחדל אם לא מציינים שפה)
    • es – ספרדית
    • hi – הינדית
    • ja – יפנית
    • ko – קוריאנית
    • pt – פורטוגזית
    • zh-TW - סינית (מסורתית)
    • zh או zh-CN – סינית (פשוטה)

ה-method של ה-HTTP וכתובת ה-URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict

גוף בקשת JSON:

{
  "instances": [
    {
      "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
    }
  ],
  "parameters": {
    "language": "PROMPT_LANGUAGE"
  }
}

כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:

curl

שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"

PowerShell

שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content
התגובה לדוגמה הבאה היא לבקשה עם "sampleCount": 2. התגובה מחזירה שני אובייקטים של חיזוי, עם בייטים של התמונה שנוצרה בקידוד Base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

המאמרים הבאים