Imagen ב-Vertex AI מספק למפתחי אפליקציות את היכולות המתקדמות של Google בתחום ה-AI הגנרטיבי. מכיוון שפיתוח הטכנולוגיה הזאת נמצא בשלב מוקדם, יכול להיות שהיכולות והשימושים המתפתחים של Imagen ב-Vertex AI יובילו ליישום שגוי, לשימוש לרעה ולתוצאות לא מכוונות או לא צפויות. לדוגמה, Imagen ב-Vertex AI יכול ליצור פלט לא צפוי, כמו תמונות פוגעניות, לא רגישות או לא מדויקות מבחינת ההקשר.
לאור הסיכונים והמורכבויות האלה, Imagen ב-Vertex AI תוכנן בהתאם לעקרונות ה-AI של Google. עם זאת, חשוב למפתחים להבין את המודלים שלהם ולבדוק אותם כדי לפרוס אותם בצורה בטוחה ואחראית. כדי לעזור למפתחים, ל-Imagen ב-Vertex AI יש מסנני בטיחות מובנים שעוזרים ללקוחות לחסום תוצאות שעלולות להיות מזיקות בתרחיש השימוש שלהם. מידע נוסף זמין בקטע בנושא מסנני בטיחות.
כשמשלבים את Imagen ב-Vertex AI בתרחיש שימוש ייחודי של לקוח ובהקשר ייחודי, יכול להיות שיהיה צורך לקחת בחשבון שיקולים נוספים של אתיקה של בינה מלאכותית ומגבלות של המודל. אנחנו ממליצים ללקוחות להשתמש בשיטות המומלצות בנושא הוגנות, יכולת פענוח, פרטיות ואבטחה.
הצגת כרטיס המודל של Imagen for Generation
הצגת כרטיס המודל של Imagen לעריכה ולהתאמה אישית
הנחיות לשימוש ב-Imagen
לפני שמשתמשים ב-Imagen ב-Vertex AI, כדאי לקרוא את מאפייני המוצר הכלליים ואת ההיבטים המשפטיים הבאים.
- מסננים ותוצאות של תמונות וטקסט: תמונות (שנוצרו או הועלו) דרך Imagen ב-Vertex AI נבדקות באמצעות מסנני בטיחות. המטרה של Imagen היא לסנן (תמונות שנוצרו או הועלו) שמפירות את מדיניות השימוש המקובל (AUP) או את ההגבלות הנוספות על מוצרים מבוססי-AI גנרטיבי. בנוסף, המטרה של המודלים הגנרטיביים שלנו ליצירת תמונות היא ליצור תוכן מקורי ולא לשכפל תוכן קיים. תכננו את המערכות שלנו במטרה להגביל את הסיכויים למקרים כאלה, ונמשיך לשפר את התפקוד שלהן. בדומה לכל ספקי שירותי הענן, Google מקפידה על מדיניות השימוש המקובל שאוסרת על לקוחות להשתמש בשירותים שלנו באופן שמפר זכויות קניין רוחני של צדדים שלישיים.
- סף מסנני בטיחות שניתן להגדרה: Google חוסמת תשובות של מודלים שעולות על ציוני המהימנות שנקבעו למאפייני בטיחות מסוימים. כדי לבקש לשנות את ערך הסף של הבטיחות, צריך לפנות לGoogle Cloud צוות ניהול החשבון.
- הוספת טקסט נתמכת בגרסאות מסוימות של המודל:
כשמשתמשים בגרסה
imagegeneration@004או בגרסאות נמוכות יותר של המודל, אי אפשר להוסיף טקסט לתמונות (שהועלו או נוצרו) באמצעות הנחיית טקסט ב-Imagen. - דיווח על חשד להתנהלות פוגעת: אפשר לדווח על חשד להתנהלות פוגעת ב-Imagen ב-Vertex AI או על פלט שנוצר ומכיל חומר בלתי הולם או מידע לא מדויק באמצעות הטופס Google Cloud לדיווח על חשד להתנהלות פוגעת.
- ביטול ההסכמה להשתתפות בתוכנית הבודקים הנאמנים: אם הצטרפתם בעבר לתוכנית הבודקים הנאמנים והסכמתם ש-Google תשתמש בנתונים שלכם כדי לשפר שירותי AI/ML במצב טרום-GA, אתם יכולים לבטל את ההסכמה באמצעות הטופס לביטול ההסכמה להשתתפות בתוכנית הבודקים הנאמנים.
מסנני בטיחות
הנחיות טקסט שמוזנות כקלט ותמונות (שנוצרו או הועלו) דרך Imagen ב-Vertex AI נבדקות מול רשימה של מסנני בטיחות, שכוללים 'קטגוריות מזיקות' (לדוגמה, violence, sexual, derogatory ו-toxic). מסנני הבטיחות האלה נועדו לסנן תוכן (שנוצר או הועלה) שמפר את מדיניות השימוש המקובל (AUP), את המדיניות בנושא שימוש אסור ב-AI גנרטיבי או את עקרונות ה-AI שלנו.
אם המודל מגיב לבקשה עם הודעת שגיאה כמו 'לא ניתן לשלוח את ההנחיה' או 'יכול להיות שהיא מפרה את המדיניות שלנו', סימן שהקלט מפעיל מסנן בטיחות. אם המערכת מחזירה פחות תמונות ממה שביקשתם, סימן שחלק מהתמונות שנוצרו נחסמו כי הן לא עומדות בדרישות הבטיחות.
אפשר לבחור את רמת הסינון של תוכן רגיש על ידי שינוי הפרמטר safetySetting.
מאפייני בטיחות
אין מיפוי של אחד לאחד בין מאפייני בטיחות לבין מסנני בטיחות. מאפייני הבטיחות הם קבוצת המאפיינים שאנחנו מחזירים למשתמש כשהמאפיין includeSafetyAttributes מוגדר. מסנני הבטיחות הם קבוצת המסננים שבה אנחנו משתמשים כדי לסנן תוכן. אנחנו לא מסננים לפי כל הקטגוריות של מאפייני הבטיחות. לדוגמה, בקטגוריית מאפייני הבטיחות 'בריאות', אנחנו לא מסננים תוכן על סמך ציון מהימנות הבריאות. בנוסף, אנחנו לא חושפים את ציוני רמת הביטחון של חלק ממסנני הבטיחות הפנימיים שלנו לתוכן רגיש.
הגדרת מסנני בטיחות
יש כמה פרמטרים של סינון בטיחותי שאפשר להשתמש בהם עם מודלים ליצירת תמונות. לדוגמה, אתם יכולים לאפשר למודל לדווח על קודי מסנני בטיחות לתוכן חסום, להשבית את יצירת האנשים או הפנים, לשנות את רגישות סינון התוכן או להחזיר ציוני בטיחות מעוגלים של רשימת מאפייני בטיחות לקלט ולפלט. מידע טכני נוסף על שדות ספציפיים זמין במאמר בנושא הפניית API של מודל ליצירת תמונות.
התשובה משתנה בהתאם לפרמטרים שהגדרתם. חלק מהפרמטרים משפיעים על התוכן שנוצר, ואחרים משפיעים על סינון התוכן ועל אופן הדיווח של הסינון. בנוסף, פורמט הפלט תלוי בשאלה אם נתוני הקלט מסוננים או אם פלט התמונה שנוצר מסונן.
פרמטרים לסינון תוכן
הפרמטרים האופציונליים הבאים משפיעים על סינון התוכן או על האופן שבו הסינון מדווח לכם:
-
safetySetting– מאפשר להגדיר את רמת האגרסיביות של הסינון כדי למנוע תוכן רגיש. -
includeRaiReason– מספק מידע מפורט יותר על הפלט המסונן. personGeneration– הגדרה שמאפשרת לכם שליטה רבה יותר ביצירת תמונות של אנשים, פנים וילדים.-
disablePersonFace– הוצא משימוש. אפשרות לבחור אם לאפשר יצירת תמונות של אנשים ופנים או לא. המשתמשים צריכים להגדיר אתpersonGenerationבמקום זאת. -
includeSafetyAttributes– מספק מידע מלא על מאפייני הבטיחות של טקסט קלט, תמונת קלט (לעריכה) וכל התמונות שנוצרו. המידע הזה כולל את קטגוריית הבטיחות (לדוגמה,"Firearms & Weapons","Illicit Drugs"או"Violence") ואת ציוני הביטחון.
קלט מסונן
אם הטקסט או התמונה שהזנתם (לצורך עריכה) מסוננים, תקבלו תשובה עם קוד השגיאה 400. אם תגדירו את includeRaiReason או את includeSafetyAttributes, בקשה עם קלט שעבר סינון על ידי RAI תחזיר את הפלט בפורמט הזה:
הפלט תלוי בגרסת המודל שבה אתם משתמשים. למטה מוצג פלט כשמסננים את הקלט לפי גרסאות שונות של המודל:
דגם
{ "error": { "code": 400, "message": "Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback." "status": "INVALID_ARGUMENT", "details": [ { "@type": "type.googleapis.com/google.rpc.DebugInfo", "detail": "[ORIGINAL ERROR] generic::invalid_argument: Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. [google.rpc.error_details_ext] { message: \"Image editing failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. Support codes: 42876398\" }" } ] } }
מודלים
{ "error": { "code": 400, "message": "Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback.", "status": "INVALID_ARGUMENT", "details": [ { "@type": "type.googleapis.com/google.rpc.DebugInfo", "detail": "[ORIGINAL ERROR] generic::invalid_argument: Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. [google.rpc.error_details_ext] { message: \"Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google\\'s Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback.\" }" } ] } }
פלט מסונן
התוכן של הפלט המסונן משתנה בהתאם לפרמטר ה-RAI שהגדרתם.
בדוגמאות הפלט הבאות מוצגת התוצאה של שימוש בפרמטרים includeRaiReason ו-includeSafetyAttributes.
פלט מסונן באמצעות includeRaiReason
אם לא מוסיפים includeRaiReason או לא מגדירים את includeRaiReason: false, התשובה כוללת רק אובייקטים של תמונות שנוצרו ולא סוננו. כל אובייקט תמונה שסונן מושמט מהמערך "predictions": []. לדוגמה, התגובה הבאה היא תגובה לבקשה עם "sampleCount": 4, אבל שתיים מהתמונות מסוננות ולכן לא נכללות בתגובה:
{ "predictions": [ { "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z" } ], "deployedModelId": "MODEL_ID" }
אם מגדירים includeRaiReason: true ומסננים כמה תמונות פלט, התגובה כוללת אובייקטים של תמונות שנוצרו ואובייקטים של includeRaiReason: true לכל תמונות הפלט שסוננו.raiFilteredReason לדוגמה, התגובה הבאה היא לבקשה עם "sampleCount": 4 ו-includeRaiReason: true, אבל שתי תמונות סוננו. כתוצאה מכך, שני אובייקטים כוללים מידע על התמונה שנוצרה, והאובייקט השלישי כולל הודעת שגיאה.
דגם
{ "predictions": [ { "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z" }, { "raiFilteredReason": "Your current safety filter threshold filtered out 2 generated images. You will not be charged for blocked images. Try rephrasing the prompt. If you think this was an error, send feedback." }, ], "deployedModelId": "MODEL_ID" }
מודלים
{ "predictions": [ { "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z" }, { "raiFilteredReason": "56562880" }, { "raiFilteredReason": "56562880" } ], "deployedModelId": "MODEL_ID" }
פלט מסונן באמצעות includeSafetyAttributes
אם מגדירים את "includeSafetyAttributes": true, מערך התגובה "predictions": [] כולל את ציוני ה-RAI (מעוגלים לספרה אחת אחרי הנקודה העשרונית) של מאפייני בטיחות הטקסט של ההנחיה החיובית. מאפייני הבטיחות של התמונות מתווספים גם לכל פלט לא מסונן. אם תמונת הפלט מסוננת, מאפייני הבטיחות שלה לא מוחזרים. לדוגמה, התגובה הבאה היא תגובה לבקשה ללא סינון, ומוחזרת תמונה אחת:
{
"predictions": [
{
"bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=",
"mimeType": "image/png",
"safetyAttributes": {
"categories": [
"Porn",
"Violence"
],
"scores": [
0.1,
0.2
]
}
},
{
"contentType": "Positive Prompt",
"safetyAttributes": {
"categories": [
"Death, Harm & Tragedy",
"Firearms & Weapons",
"Hate",
"Health",
"Illicit Drugs",
"Politics",
"Porn",
"Religion & Belief",
"Toxic",
"Violence",
"Vulgarity",
"War & Conflict"
],
"scores": [
0,
0,
0,
0,
0,
0,
0.2,
0,
0.1,
0,
0.1,
0
]
}
},
],
"deployedModelId": "MODEL_ID"
}
קטגוריות של קוד מסנן הבטיחות
בהתאם למסנני הבטיחות שהגדרתם, יכול להיות שהפלט יכלול קוד סיבת בטיחות שדומה לזה:
{
"raiFilteredReason": "ERROR_MESSAGE. Support codes: 56562880""
}הקוד שמופיע תואם לקטגוריה ספציפית של תוכן מזיק. מיפוי הקודים לקטגוריות הוא כזה:
| קוד שגיאה | קטגוריית בטיחות | תיאור | תוכן שסונן: קלט של הנחיה או פלט של תמונה |
|---|---|---|---|
| 58061214 17301594 |
צאצא | מזהה תוכן לילדים במקרים שבהם הוא לא מותר בגלל ההגדרות של בקשת ה-API או בגלל רשימת ההיתרים. | קלט (הנחיה): 58061214 פלט (תמונה): 17301594 |
| 29310472 15236754 |
סלבריטי | מזהה ייצוג פוטו-ריאליסטי של ידוען בבקשה. | קלט (הנחיה): 29310472 פלט (תמונה): 15236754 |
| 62263041 | תוכן מסוכן | מזהה תוכן שעלול להיות מסוכן. | קלט (הנחיה) |
| 57734940 22137204 |
שנאה | מזהה נושאים או תוכן שקשורים לשנאה. | קלט (הנחיה): 57734940 פלט (תמונה): 22137204 |
| 74803281 29578790 42876398 |
אחר | מזהה בעיות בטיחות שונות אחרות בבקשה. | קלט (הנחיה): 42876398 פלט (תמונה): 29578790, 74803281 |
| 39322892 | אנשים/פנים | מזהה אדם או פנים כשהדבר לא מותר בגלל הגדרות הבטיחות של הבקשה. | פלט (תמונה) |
| 92201652 | פרטים אישיים | מזהה פרטים אישיים מזהים (PII) בטקסט, כמו אזכור של מספר כרטיס אשראי, כתובות מגורים או מידע דומה. | קלט (הנחיה) |
| 89371032 49114662 72817394 |
תוכן אסור | מזהה את הבקשה לתוכן אסור בבקשה. | קלט (הנחיה): 89371032 פלט (תמונה): 49114662, 72817394 |
| 90789179 63429089 43188360 |
תוכן מיני | מזהה תוכן בעל אופי מיני. | קלט (הנחיה): 90789179 פלט (תמונה): 63429089, 43188360 |
| 35561574 35561575 |
תוכן של צד שלישי | אמצעי הגנה שקשורים לתוכן של צד שלישי. | קלט (הנחיה) פלט (תמונה) |
| 78610348 | רעיל | מזהה נושאים או תוכן רעילים בטקסט. | קלט (הנחיה) |
| 61493863 56562880 |
אלימות | מזהה תוכן שקשור לאלימות בתמונה או בטקסט. | קלט (הנחיה): 61493863 פלט (תמונה): 56562880 |
| 32635315 | גס | מזהה נושאים או תוכן גסים בטקסט. | קלט (הנחיה) |
| 64151117 | סלבריטי או ילד/ה | מזהה ייצוג פוטוריאליסטי של ידוען או של ילד שמפר את מדיניות הבטיחות של Google. | קלט (הנחיה) פלט (תמונה) |
מגבלות
המגבלות הבאות חלות על משימות שונות:
מגבלות על יצירת תמונות ועריכתן
- הגברת הטיה: למרות שמודל Imagen ב-Vertex AI יכול ליצור תמונות באיכות גבוהה, יכול להיות שיהיו הטיות פוטנציאליות בתוכן שנוצר. התמונות שנוצרות מבוססות על נתוני האימון של המוצר, שיכולים לכלול הטיה באופן לא מכוון. ההטיה הזו עלולה להנציח סטריאוטיפים או להפלות קבוצות מסוימות. כדי לוודא שהתוצאות תואמות למדיניות השימוש המקובל של Google ולתרחיש השימוש שלכם, חשוב לבצע מעקב והערכה קפדניים.
- שקיפות וגילוי נאות: למשתמשים קשה להבדיל בין תמונות שנוצרו על ידי AI לבין תמונות שלא נוצרו על ידי AI. כשמשתמשים בתמונות שנוצרו על ידי AI בתרחיש השימוש, חשוב לציין למשתמשים באופן ברור שהתמונות נוצרו על ידי מערכת AI, כדי להבטיח שקיפות ולשמור על האמון בתהליך. הוספנו תוויות מטא-נתונים לתמונות שנוצרו על ידי AI כדי להילחם בסיכון להפצת מידע מוטעה, וכחלק מהגישה האחראית שלנו ל-AI.
- הקשר לא מספיק: יכול להיות של-Imagen ב-Vertex AI אין את ההבנה ההקשרית שנדרשת כדי ליצור תמונות שמתאימות לכל המצבים או הקהלים בתרחיש השימוש שלכם. חשוב לוודא שהתמונות שנוצרו תואמות להקשר, למטרה ולקהל היעד שבחרתם.
- מצג שווא ואותנטיות: עריכת תמונות באמצעות Imagen ב-Vertex AI עלולה לגרום למצג שווא או למניפולציה של תמונות, ועלולה להוביל ליצירת תוכן מטעה. חשוב לוודא שתהליך העריכה נעשה בצורה אחראית, בלי לפגוע באותנטיות ובאמינות של התמונות שעורכות. הוספנו תיוג של מטא-נתונים לתמונות שעברו עריכה באמצעות AI כדי לצמצם את הסיכון למידע מוטעה, וכחלק מהגישה האחראית שלנו ל-AI.
- מצג שווא ואותנטיות: חשוב לנקוט משנה זהירות כשעורכים תמונות של מבוגרים או ילדים, כי עריכת תמונות באמצעות Imagen ב-Vertex AI עלולה להוביל למצג שווא או למניפולציה של תמונות. הדבר עלול להוביל ליצירת תוכן מטעה או שקרי. חשוב לוודא שתהליך העריכה מתבצע באופן אחראי, בלי לפגוע באותנטיות ובאמינות של התמונות שעורכים. הוספנו תיוג של מטא-נתונים לתמונות שעברו עריכה באמצעות AI, כדי לצמצם את הסיכון למידע מוטעה וכחלק מהגישה האחראית שלנו ל-AI.
מגבלות של יצירת תיאורים לתמונות
- דיוק ורגישות להקשר: יצירת תיאורים לתמונות עשויה להיתקל בקשיים בתיאור מדויק של תמונות מורכבות או דו-משמעיות. יכול להיות שהתיאורים שנוצרו לא תמיד יציגו את ההקשר המלא או את הניואנסים של התוכן החזותי. חשוב להבין שלמערכות אוטומטיות ליצירת כתוביות יש מגבלות בהבנת תמונות ברמות מורכבות שונות, ולכן צריך להשתמש בתיאורים שלהן בזהירות, במיוחד בהקשרים קריטיים או רגישים.
- דו-משמעות ופרשנויות סובייקטיביות: לעיתים קרובות אפשר לפרש תמונות בכמה דרכים, והכתוביות שנוצרות לא תמיד תואמות להבנה או לציפיות של בני אדם. אנשים שונים עשויים לתפוס ולתאר תמונות בצורה שונה, על סמך החוויות הסובייקטיביות והרקע התרבותי שלהם. חשוב מאוד לקחת בחשבון את האפשרות לפרשנות דו-משמעית ולסובייקטיביות בתיאורי תמונות, ולספק הקשר נוסף או פרשנויות חלופיות כשצריך.
- שיקולי נגישות: כיתובים אוטומטיים לתמונות יכולים לתמוך בנגישות על ידי מתן תיאורים לאנשים עם לקויות ראייה, אבל חשוב להבין שהם לא יכולים להחליף באופן מלא טקסט חלופי או תיאורים שנוצרו על ידי בני אדם ומותאמים לצרכי נגישות ספציפיים. יכול להיות שכתוביות אוטומטיות לא יכללו את רמת הפירוט או ההבנה ההקשרית שנדרשות בתרחישי שימוש מסוימים של נגישות.
מגבלות של מענה חזותי לשאלות (VQA)
- ביטחון מופרז ואי-ודאות: לפעמים מודלים של VQA מספקים תשובות בביטחון מופרז, גם כשהתשובה הנכונה לא ודאית או דו-משמעית. חשוב להעביר את אי הוודאות של המודל ולספק ציוני מהימנות מתאימים או תשובות חלופיות כשיש דו-משמעות, במקום להעביר תחושה שגויה של ודאות.
שיטות מומלצות
כדי להשתמש בטכנולוגיה הזו בצורה בטוחה ואחראית, חשוב גם לקחת בחשבון סיכונים אחרים שספציפיים לתרחיש השימוש, למשתמשים ולסביבה העסקית שלכם, בנוסף לאמצעי ההגנה הטכניים המובנים.
מומלץ לבצע את השלבים הבאים:
- הערכת סיכוני האבטחה של האפליקציה.
- כדאי לשקול לבצע שינויים כדי לצמצם את סיכוני הבטיחות.
- לבצע בדיקות בטיחות שמתאימות לתרחיש השימוש.
- לבקש משוב מהמשתמשים ולעקוב אחרי התוכן.
מקורות מידע נוספים בנושא אתיקה של בינה מלאכותית
- מידע נוסף על אתיקה של בינה מלאכותית במודלים גדולים של שפה (LLM)
- מידע נוסף על ההמלצות של Google בנושא שיטות לפיתוח אחראי של AI
- מומלץ לקרוא את הפוסט בבלוג שלנו, סדר יום משותף לקידום האתיקה של בינה מלאכותית
שליחת משוב על Imagen ב-Vertex AI
אם תקבלו פלט או תשובה לא מדויקים או לא בטוחים לדעתכם, תוכלו לשלוח לנו משוב. המשוב שלכם יכול לעזור לנו לשפר את Imagen ב-Vertex AI ואת שאר הפעילויות של Google בתחום ה-AI.
יכול להיות שבודקים אנושיים יקראו את המשוב, ולכן כדאי לא לשלוח נתונים שמכילים מידע אישי, סודי או רגיש.