אתיקה של בינה מלאכותית והנחיות שימוש ב-Imagen

‫Imagen ב-Vertex AI מספק למפתחי אפליקציות את היכולות המתקדמות של Google בתחום ה-AI הגנרטיבי. מכיוון שפיתוח הטכנולוגיה הזאת נמצא בשלב מוקדם, יכול להיות שהיכולות והשימושים המתפתחים של Imagen ב-Vertex AI יובילו ליישום שגוי, לשימוש לרעה ולתוצאות לא מכוונות או לא צפויות. לדוגמה, Imagen ב-Vertex AI יכול ליצור פלט לא צפוי, כמו תמונות פוגעניות, לא רגישות או לא מדויקות מבחינת ההקשר.

לאור הסיכונים והמורכבויות האלה, Imagen ב-Vertex AI תוכנן בהתאם לעקרונות ה-AI של Google. עם זאת, חשוב למפתחים להבין את המודלים שלהם ולבדוק אותם כדי לפרוס אותם בצורה בטוחה ואחראית. כדי לעזור למפתחים, ל-Imagen ב-Vertex AI יש מסנני בטיחות מובנים שעוזרים ללקוחות לחסום תוצאות שעלולות להיות מזיקות בתרחיש השימוש שלהם. מידע נוסף זמין בקטע בנושא מסנני בטיחות.

כשמשלבים את Imagen ב-Vertex AI בתרחיש שימוש ייחודי של לקוח ובהקשר ייחודי, יכול להיות שיהיה צורך לקחת בחשבון שיקולים נוספים של אתיקה של בינה מלאכותית ומגבלות של המודל. אנחנו ממליצים ללקוחות להשתמש בשיטות המומלצות בנושא הוגנות, יכולת פענוח, פרטיות ואבטחה.

הצגת כרטיס המודל של Imagen for Generation

הצגת כרטיס המודל של Imagen לעריכה ולהתאמה אישית

הנחיות לשימוש ב-Imagen

לפני שמשתמשים ב-Imagen ב-Vertex AI, כדאי לקרוא את מאפייני המוצר הכלליים ואת ההיבטים המשפטיים הבאים.

  • מסננים ותוצאות של תמונות וטקסט: תמונות (שנוצרו או הועלו) דרך Imagen ב-Vertex AI נבדקות באמצעות מסנני בטיחות. המטרה של Imagen היא לסנן (תמונות שנוצרו או הועלו) שמפירות את מדיניות השימוש המקובל (AUP) או את ההגבלות הנוספות על מוצרים מבוססי-AI גנרטיבי. בנוסף, המטרה של המודלים הגנרטיביים שלנו ליצירת תמונות היא ליצור תוכן מקורי ולא לשכפל תוכן קיים. תכננו את המערכות שלנו במטרה להגביל את הסיכויים למקרים כאלה, ונמשיך לשפר את התפקוד שלהן. בדומה לכל ספקי שירותי הענן, Google מקפידה על מדיניות השימוש המקובל שאוסרת על לקוחות להשתמש בשירותים שלנו באופן שמפר זכויות קניין רוחני של צדדים שלישיים.
  • סף מסנני בטיחות שניתן להגדרה: Google חוסמת תשובות של מודלים שעולות על ציוני המהימנות שנקבעו למאפייני בטיחות מסוימים. כדי לבקש לשנות את ערך הסף של הבטיחות, צריך לפנות לGoogle Cloud צוות ניהול החשבון.
  • הוספת טקסט נתמכת בגרסאות מסוימות של המודל: כשמשתמשים בגרסה imagegeneration@004 או בגרסאות נמוכות יותר של המודל, אי אפשר להוסיף טקסט לתמונות (שהועלו או נוצרו) באמצעות הנחיית טקסט ב-Imagen.
  • דיווח על חשד להתנהלות פוגעת: אפשר לדווח על חשד להתנהלות פוגעת ב-Imagen ב-Vertex AI או על פלט שנוצר ומכיל חומר בלתי הולם או מידע לא מדויק באמצעות הטופס Google Cloud לדיווח על חשד להתנהלות פוגעת.
  • ביטול ההסכמה להשתתפות בתוכנית הבודקים הנאמנים: אם הצטרפתם בעבר לתוכנית הבודקים הנאמנים והסכמתם ש-Google תשתמש בנתונים שלכם כדי לשפר שירותי AI/ML במצב טרום-GA, אתם יכולים לבטל את ההסכמה באמצעות הטופס לביטול ההסכמה להשתתפות בתוכנית הבודקים הנאמנים.

מסנני בטיחות

הנחיות טקסט שמוזנות כקלט ותמונות (שנוצרו או הועלו) דרך Imagen ב-Vertex AI נבדקות מול רשימה של מסנני בטיחות, שכוללים 'קטגוריות מזיקות' (לדוגמה, violence, sexual, derogatory ו-toxic). מסנני הבטיחות האלה נועדו לסנן תוכן (שנוצר או הועלה) שמפר את מדיניות השימוש המקובל (AUP), את המדיניות בנושא שימוש אסור ב-AI גנרטיבי או את עקרונות ה-AI שלנו.

אם המודל מגיב לבקשה עם הודעת שגיאה כמו 'לא ניתן לשלוח את ההנחיה' או 'יכול להיות שהיא מפרה את המדיניות שלנו', סימן שהקלט מפעיל מסנן בטיחות. אם המערכת מחזירה פחות תמונות ממה שביקשתם, סימן שחלק מהתמונות שנוצרו נחסמו כי הן לא עומדות בדרישות הבטיחות.

אפשר לבחור את רמת הסינון של תוכן רגיש על ידי שינוי הפרמטר safetySetting.

מאפייני בטיחות

אין מיפוי של אחד לאחד בין מאפייני בטיחות לבין מסנני בטיחות. מאפייני הבטיחות הם קבוצת המאפיינים שאנחנו מחזירים למשתמש כשהמאפיין includeSafetyAttributes מוגדר. מסנני הבטיחות הם קבוצת המסננים שבה אנחנו משתמשים כדי לסנן תוכן. אנחנו לא מסננים לפי כל הקטגוריות של מאפייני הבטיחות. לדוגמה, בקטגוריית מאפייני הבטיחות 'בריאות', אנחנו לא מסננים תוכן על סמך ציון מהימנות הבריאות. בנוסף, אנחנו לא חושפים את ציוני רמת הביטחון של חלק ממסנני הבטיחות הפנימיים שלנו לתוכן רגיש.

הגדרת מסנני בטיחות

יש כמה פרמטרים של סינון בטיחותי שאפשר להשתמש בהם עם מודלים ליצירת תמונות. לדוגמה, אתם יכולים לאפשר למודל לדווח על קודי מסנני בטיחות לתוכן חסום, להשבית את יצירת האנשים או הפנים, לשנות את רגישות סינון התוכן או להחזיר ציוני בטיחות מעוגלים של רשימת מאפייני בטיחות לקלט ולפלט. מידע טכני נוסף על שדות ספציפיים זמין במאמר בנושא הפניית API של מודל ליצירת תמונות.

התשובה משתנה בהתאם לפרמטרים שהגדרתם. חלק מהפרמטרים משפיעים על התוכן שנוצר, ואחרים משפיעים על סינון התוכן ועל אופן הדיווח של הסינון. בנוסף, פורמט הפלט תלוי בשאלה אם נתוני הקלט מסוננים או אם פלט התמונה שנוצר מסונן.

פרמטרים לסינון תוכן

הפרמטרים האופציונליים הבאים משפיעים על סינון התוכן או על האופן שבו הסינון מדווח לכם:

  • safetySetting – מאפשר להגדיר את רמת האגרסיביות של הסינון כדי למנוע תוכן רגיש.
  • includeRaiReason – מספק מידע מפורט יותר על הפלט המסונן.
  • personGeneration – הגדרה שמאפשרת לכם שליטה רבה יותר ביצירת תמונות של אנשים, פנים וילדים.
  • disablePersonFace – הוצא משימוש. אפשרות לבחור אם לאפשר יצירת תמונות של אנשים ופנים או לא. המשתמשים צריכים להגדיר את personGeneration במקום זאת.
  • includeSafetyAttributes – מספק מידע מלא על מאפייני הבטיחות של טקסט קלט, תמונת קלט (לעריכה) וכל התמונות שנוצרו. המידע הזה כולל את קטגוריית הבטיחות (לדוגמה, "Firearms & Weapons", "Illicit Drugs" או "Violence") ואת ציוני הביטחון.

קלט מסונן

אם הטקסט או התמונה שהזנתם (לצורך עריכה) מסוננים, תקבלו תשובה עם קוד השגיאה 400. אם תגדירו את includeRaiReason או את includeSafetyAttributes, בקשה עם קלט שעבר סינון על ידי RAI תחזיר את הפלט בפורמט הזה:

הפלט תלוי בגרסת המודל שבה אתם משתמשים. למטה מוצג פלט כשמסננים את הקלט לפי גרסאות שונות של המודל:

דגם

{
  "error": {
    "code": 400,
    "message": "Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback."
    "status": "INVALID_ARGUMENT",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.DebugInfo",
        "detail": "[ORIGINAL ERROR] generic::invalid_argument: Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. [google.rpc.error_details_ext] { message: \"Image editing failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. Support codes: 42876398\" }"
      }
    ]
  }
}

מודלים

{
  "error": {
    "code": 400,
    "message": "Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback.",
    "status": "INVALID_ARGUMENT",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.DebugInfo",
        "detail": "[ORIGINAL ERROR] generic::invalid_argument: Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google's Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback. [google.rpc.error_details_ext] { message: \"Image generation failed with the following error: The prompt could not be submitted. This prompt contains sensitive words that violate Google\\'s Responsible AI practices. Try rephrasing the prompt. If you think this was an error, send feedback.\" }"
      }
    ]
  }
}

פלט מסונן

התוכן של הפלט המסונן משתנה בהתאם לפרמטר ה-RAI שהגדרתם. בדוגמאות הפלט הבאות מוצגת התוצאה של שימוש בפרמטרים includeRaiReason ו-includeSafetyAttributes.

פלט מסונן באמצעות includeRaiReason

אם לא מוסיפים includeRaiReason או לא מגדירים את includeRaiReason: false, התשובה כוללת רק אובייקטים של תמונות שנוצרו ולא סוננו. כל אובייקט תמונה שסונן מושמט מהמערך "predictions": []. לדוגמה, התגובה הבאה היא תגובה לבקשה עם "sampleCount": 4, אבל שתיים מהתמונות מסוננות ולכן לא נכללות בתגובה:

{
  "predictions": [
    {
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z"
    }
  ],
  "deployedModelId": "MODEL_ID"
}

אם מגדירים includeRaiReason: true ומסננים כמה תמונות פלט, התגובה כוללת אובייקטים של תמונות שנוצרו ואובייקטים של includeRaiReason: true לכל תמונות הפלט שסוננו.raiFilteredReason לדוגמה, התגובה הבאה היא לבקשה עם "sampleCount": 4 ו-includeRaiReason: true, אבל שתי תמונות סוננו. כתוצאה מכך, שני אובייקטים כוללים מידע על התמונה שנוצרה, והאובייקט השלישי כולל הודעת שגיאה.

דגם

{
  "predictions": [
    {
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z"
    },
    {
      "raiFilteredReason": "Your current safety filter threshold filtered out 2 generated images. You will not be charged for blocked images. Try rephrasing the prompt. If you think this was an error, send feedback."
    },
  ],
  "deployedModelId": "MODEL_ID"
}

מודלים

{
  "predictions": [
    {
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]Ct+F+1SLLH/2+SJ4ZLdOvg//Z"
    },
    {
      "raiFilteredReason": "56562880"
    },
    {
      "raiFilteredReason": "56562880"
    }
  ],
  "deployedModelId": "MODEL_ID"
}
פלט מסונן באמצעות includeSafetyAttributes

אם מגדירים את "includeSafetyAttributes": true, מערך התגובה "predictions": [] כולל את ציוני ה-RAI (מעוגלים לספרה אחת אחרי הנקודה העשרונית) של מאפייני בטיחות הטקסט של ההנחיה החיובית. מאפייני הבטיחות של התמונות מתווספים גם לכל פלט לא מסונן. אם תמונת הפלט מסוננת, מאפייני הבטיחות שלה לא מוחזרים. לדוגמה, התגובה הבאה היא תגובה לבקשה ללא סינון, ומוחזרת תמונה אחת:

{
  "predictions": [
    {
      "bytesBase64Encoded": "/9j/4AAQSkZJRgABA[...]bdsdgD2PLbZQfW96HEFE/9k=",
      "mimeType": "image/png", 
      "safetyAttributes": {
        "categories": [
          "Porn",
          "Violence"
        ],
        "scores": [
          0.1,
          0.2
        ]
      } 
    }, 
    {
      "contentType": "Positive Prompt",
      "safetyAttributes": {
        "categories": [
          "Death, Harm & Tragedy",
          "Firearms & Weapons",
          "Hate",
          "Health",
          "Illicit Drugs",
          "Politics",
          "Porn",
          "Religion & Belief",
          "Toxic",
          "Violence",
          "Vulgarity",
          "War & Conflict"
        ],
        "scores": [
          0,
          0,
          0,
          0,
          0,
          0,
          0.2,
          0,
          0.1,
          0,
          0.1,
          0
        ]
      }
    }, 
  ],
  "deployedModelId": "MODEL_ID"
}

קטגוריות של קוד מסנן הבטיחות

בהתאם למסנני הבטיחות שהגדרתם, יכול להיות שהפלט יכלול קוד סיבת בטיחות שדומה לזה:

    {
      "raiFilteredReason": "ERROR_MESSAGE. Support codes: 56562880""
    }

הקוד שמופיע תואם לקטגוריה ספציפית של תוכן מזיק. מיפוי הקודים לקטגוריות הוא כזה:

קוד שגיאה קטגוריית בטיחות תיאור תוכן שסונן: קלט של הנחיה או פלט של תמונה
58061214
17301594
צאצא מזהה תוכן לילדים במקרים שבהם הוא לא מותר בגלל ההגדרות של בקשת ה-API או בגלל רשימת ההיתרים. קלט (הנחיה): 58061214
פלט (תמונה): 17301594
29310472
15236754
סלבריטי מזהה ייצוג פוטו-ריאליסטי של ידוען בבקשה. קלט (הנחיה): 29310472
פלט (תמונה): 15236754
62263041 תוכן מסוכן מזהה תוכן שעלול להיות מסוכן. קלט (הנחיה)
57734940
22137204
שנאה מזהה נושאים או תוכן שקשורים לשנאה. קלט (הנחיה): 57734940
פלט (תמונה): 22137204
74803281
29578790
42876398
אחר מזהה בעיות בטיחות שונות אחרות בבקשה. קלט (הנחיה): 42876398
פלט (תמונה): 29578790, 74803281
39322892 אנשים/פנים מזהה אדם או פנים כשהדבר לא מותר בגלל הגדרות הבטיחות של הבקשה. פלט (תמונה)
92201652 פרטים אישיים מזהה פרטים אישיים מזהים (PII) בטקסט, כמו אזכור של מספר כרטיס אשראי, כתובות מגורים או מידע דומה. קלט (הנחיה)
89371032
49114662
72817394
תוכן אסור מזהה את הבקשה לתוכן אסור בבקשה. קלט (הנחיה): 89371032
פלט (תמונה): 49114662, ‏ 72817394
90789179
63429089
43188360
תוכן מיני מזהה תוכן בעל אופי מיני. קלט (הנחיה): 90789179
פלט (תמונה): 63429089, 43188360
35561574
35561575
תוכן של צד שלישי אמצעי הגנה שקשורים לתוכן של צד שלישי. קלט (הנחיה)
פלט (תמונה)
78610348 רעיל מזהה נושאים או תוכן רעילים בטקסט. קלט (הנחיה)
61493863
56562880
אלימות מזהה תוכן שקשור לאלימות בתמונה או בטקסט. קלט (הנחיה): 61493863
פלט (תמונה): 56562880
32635315 גס מזהה נושאים או תוכן גסים בטקסט. קלט (הנחיה)
64151117 סלבריטי או ילד/ה מזהה ייצוג פוטוריאליסטי של ידוען או של ילד שמפר את מדיניות הבטיחות של Google. קלט (הנחיה)
פלט (תמונה)

מגבלות

המגבלות הבאות חלות על משימות שונות:

מגבלות על יצירת תמונות ועריכתן

  • הגברת הטיה: למרות שמודל Imagen ב-Vertex AI יכול ליצור תמונות באיכות גבוהה, יכול להיות שיהיו הטיות פוטנציאליות בתוכן שנוצר. התמונות שנוצרות מבוססות על נתוני האימון של המוצר, שיכולים לכלול הטיה באופן לא מכוון. ההטיה הזו עלולה להנציח סטריאוטיפים או להפלות קבוצות מסוימות. כדי לוודא שהתוצאות תואמות למדיניות השימוש המקובל של Google ולתרחיש השימוש שלכם, חשוב לבצע מעקב והערכה קפדניים.
  • שקיפות וגילוי נאות: למשתמשים קשה להבדיל בין תמונות שנוצרו על ידי AI לבין תמונות שלא נוצרו על ידי AI. כשמשתמשים בתמונות שנוצרו על ידי AI בתרחיש השימוש, חשוב לציין למשתמשים באופן ברור שהתמונות נוצרו על ידי מערכת AI, כדי להבטיח שקיפות ולשמור על האמון בתהליך. הוספנו תוויות מטא-נתונים לתמונות שנוצרו על ידי AI כדי להילחם בסיכון להפצת מידע מוטעה, וכחלק מהגישה האחראית שלנו ל-AI.
  • הקשר לא מספיק: יכול להיות של-Imagen ב-Vertex AI אין את ההבנה ההקשרית שנדרשת כדי ליצור תמונות שמתאימות לכל המצבים או הקהלים בתרחיש השימוש שלכם. חשוב לוודא שהתמונות שנוצרו תואמות להקשר, למטרה ולקהל היעד שבחרתם.
  • מצג שווא ואותנטיות: עריכת תמונות באמצעות Imagen ב-Vertex AI עלולה לגרום למצג שווא או למניפולציה של תמונות, ועלולה להוביל ליצירת תוכן מטעה. חשוב לוודא שתהליך העריכה נעשה בצורה אחראית, בלי לפגוע באותנטיות ובאמינות של התמונות שעורכות. הוספנו תיוג של מטא-נתונים לתמונות שעברו עריכה באמצעות AI כדי לצמצם את הסיכון למידע מוטעה, וכחלק מהגישה האחראית שלנו ל-AI.
  • מצג שווא ואותנטיות: חשוב לנקוט משנה זהירות כשעורכים תמונות של מבוגרים או ילדים, כי עריכת תמונות באמצעות Imagen ב-Vertex AI עלולה להוביל למצג שווא או למניפולציה של תמונות. הדבר עלול להוביל ליצירת תוכן מטעה או שקרי. חשוב לוודא שתהליך העריכה מתבצע באופן אחראי, בלי לפגוע באותנטיות ובאמינות של התמונות שעורכים. הוספנו תיוג של מטא-נתונים לתמונות שעברו עריכה באמצעות AI, כדי לצמצם את הסיכון למידע מוטעה וכחלק מהגישה האחראית שלנו ל-AI.

מגבלות של יצירת תיאורים לתמונות

  • דיוק ורגישות להקשר: יצירת תיאורים לתמונות עשויה להיתקל בקשיים בתיאור מדויק של תמונות מורכבות או דו-משמעיות. יכול להיות שהתיאורים שנוצרו לא תמיד יציגו את ההקשר המלא או את הניואנסים של התוכן החזותי. חשוב להבין שלמערכות אוטומטיות ליצירת כתוביות יש מגבלות בהבנת תמונות ברמות מורכבות שונות, ולכן צריך להשתמש בתיאורים שלהן בזהירות, במיוחד בהקשרים קריטיים או רגישים.
  • דו-משמעות ופרשנויות סובייקטיביות: לעיתים קרובות אפשר לפרש תמונות בכמה דרכים, והכתוביות שנוצרות לא תמיד תואמות להבנה או לציפיות של בני אדם. אנשים שונים עשויים לתפוס ולתאר תמונות בצורה שונה, על סמך החוויות הסובייקטיביות והרקע התרבותי שלהם. חשוב מאוד לקחת בחשבון את האפשרות לפרשנות דו-משמעית ולסובייקטיביות בתיאורי תמונות, ולספק הקשר נוסף או פרשנויות חלופיות כשצריך.
  • שיקולי נגישות: כיתובים אוטומטיים לתמונות יכולים לתמוך בנגישות על ידי מתן תיאורים לאנשים עם לקויות ראייה, אבל חשוב להבין שהם לא יכולים להחליף באופן מלא טקסט חלופי או תיאורים שנוצרו על ידי בני אדם ומותאמים לצרכי נגישות ספציפיים. יכול להיות שכתוביות אוטומטיות לא יכללו את רמת הפירוט או ההבנה ההקשרית שנדרשות בתרחישי שימוש מסוימים של נגישות.

מגבלות של מענה חזותי לשאלות (VQA)

  • ביטחון מופרז ואי-ודאות: לפעמים מודלים של VQA מספקים תשובות בביטחון מופרז, גם כשהתשובה הנכונה לא ודאית או דו-משמעית. חשוב להעביר את אי הוודאות של המודל ולספק ציוני מהימנות מתאימים או תשובות חלופיות כשיש דו-משמעות, במקום להעביר תחושה שגויה של ודאות.

כדי להשתמש בטכנולוגיה הזו בצורה בטוחה ואחראית, חשוב גם לקחת בחשבון סיכונים אחרים שספציפיים לתרחיש השימוש, למשתמשים ולסביבה העסקית שלכם, בנוסף לאמצעי ההגנה הטכניים המובנים.

מומלץ לבצע את השלבים הבאים:

  1. הערכת סיכוני האבטחה של האפליקציה.
  2. כדאי לשקול לבצע שינויים כדי לצמצם את סיכוני הבטיחות.
  3. לבצע בדיקות בטיחות שמתאימות לתרחיש השימוש.
  4. לבקש משוב מהמשתמשים ולעקוב אחרי התוכן.

מקורות מידע נוספים בנושא אתיקה של בינה מלאכותית

שליחת משוב על Imagen ב-Vertex AI

אם תקבלו פלט או תשובה לא מדויקים או לא בטוחים לדעתכם, תוכלו לשלוח לנו משוב. המשוב שלכם יכול לעזור לנו לשפר את Imagen ב-Vertex AI ואת שאר הפעילויות של Google בתחום ה-AI.

יכול להיות שבודקים אנושיים יקראו את המשוב, ולכן כדאי לא לשלוח נתונים שמכילים מידע אישי, סודי או רגיש.