אתיקה של בינה מלאכותית

מודלים גדולים של שפה (LLM) יכולים לתרגם שפה, לסכם טקסט, ליצור כתיבה יצירתית, ליצור קוד, להפעיל צ'אטבוטים ועוזרים וירטואליים, ולהשלים מנועי חיפוש ומערכות המלצות. יחד עם זאת, כטכנולוגיה בשלבי פיתוח ראשוניים, היכולות והשימושים שלה מתפתחים ויוצרים פוטנציאל לשימוש לא נכון, לשימוש לרעה ולתוצאות לא מכוונות או לא צפויות. מודלים גדולים של שפה יכולים ליצור פלט לא צפוי, כולל טקסט פוגעני, חסר רגישות או לא מדויק מבחינה עובדתית.

בנוסף, הרבגוניות המדהימה של מודלים מסוג LLM היא גם מה שמקשה לחזות בדיוק אילו סוגים של תוצאות לא מכוונות או לא צפויות הם עשויים להפיק. לאור הסיכונים והמורכבויות האלה, ממשקי ה-API של Vertex AI ל-AI גנרטיבי מתוכננים בהתאם לעקרונות ה-AI של Google. עם זאת, חשוב שהמפתחים יבינו את המודלים שלהם ויבדקו אותם כדי לפרוס אותם בצורה בטוחה ואחראית. כדי לעזור למפתחים, ב-Vertex AI Studio יש סינון תוכן מובנה, ובממשקי ה-API של ה-AI הגנרטיבי שלנו יש ניקוד של מאפייני בטיחות. כך הלקוחות יכולים לבדוק את מסנני הבטיחות של Google ולהגדיר ספי אמון שמתאימים לתרחיש השימוש ולעסק שלהם. מידע נוסף מפורט בקטע מסנני בטיחות ומאפיינים.

כשממשקי ה-API הגנרטיביים שלנו משולבים בתרחיש שימוש ובהקשר ייחודיים לכם, יכול להיות שתצטרכו לקחת בחשבון שיקולים נוספים של אתיקה של בינה מלאכותית ומגבלות. אנחנו ממליצים ללקוחות לקדם הוגנות, יכולת פענוח, פרטיות ואבטחה באמצעות שיטות מומלצות.

מסנני בטיחות ומאפיינים

מידע על שימוש במסנני בטיחות ובמאפיינים של API זמין במאמר Gemini API ב-Vertex AI.

מגבלות המודל

ההגבלות שאתם עלולים להיתקל בהן כשאתם משתמשים במודלים של AI גנרטיבי כוללות (אבל לא רק):

  • מקרי קצה: מקרי קצה הם מצבים חריגים, נדירים או יוצאי דופן שלא מיוצגים היטב בנתוני האימון. המקרים האלה עלולים להוביל למגבלות בביצועים של המודל, כמו ביטחון יתר של המודל, פרשנות שגויה של ההקשר או פלטים לא הולמים.

  • הזיות של מודלים, ביסוס על עובדות ודיוק: מודלים של AI גנרטיבי עלולים לספק תשובות שלא תואמות נתונים (hallucination), כלומר לטעון שמידע לא מדויק הוא עובדות אמיתיות. המגבלה הזו עלולה לגרום להזיות של המודל, כלומר למקרים שבהם הוא יוצר פלט שנשמע סביר אבל העובדות שבו שגויות, לא רלוונטיות, לא הולמות או חסרות משמעות. כדי להקטין את הסיכוי הזה, אפשר להצמיד את המודלים לנתונים הספציפיים שלכם. מידע נוסף על Grounding ב-Vertex AI זמין בסקירה הכללית על Grounding.

  • איכות הנתונים וכוונון: האיכות, הדיוק וההטיה של ההנחיה או של נתוני הקלט במודל יכולים להשפיע באופן משמעותי על הביצועים שלו. אם המשתמשים מזינים נתונים או הנחיות לא מדויקים או שגויים, יכול להיות שהביצועים של המודל לא יהיו אופטימליים או שהפלט של המודל יהיה שגוי.

  • הגברת ההטיה: מודלים של AI גנרטיבי יכולים להגביר בטעות הטיות קיימות בנתוני האימון שלהם, וכך להוביל לפלט שיכול לחזק עוד יותר דעות קדומות בחברה ויחס לא שוויוני לקבוצות מסוימות.

  • איכות השפה: המודלים מניבים יכולות מרשימות בריבוי שפות במבחני ההשוואה שביצענו, אבל רוב מבחני ההשוואה שלנו (כולל כל ההערכות בנושא הוגנות) הם באנגלית. מידע נוסף זמין בבלוג של צוות המחקר של Google.

    • מודלים של AI גנרטיבי יכולים לספק איכות שירות לא עקבית למשתמשים שונים. לדוגמה, יכול להיות שיצירת טקסט לא תהיה יעילה במקרים מסוימים של ניבים או שפות שונות, כי הם לא מיוצגים מספיק בנתוני האימון. הביצועים יכולים להיות גרועים יותר בשפות שאינן אנגלית או בניבים של השפה האנגלית שפחות מיוצגים.
  • קבוצות משנה ומדדי הוגנות: ניתוחי ההוגנות של Google Research במודלים של ה-AI הגנרטיבי שלנו לא מספקים תיאור מקיף של הסיכונים הפוטנציאליים השונים. לדוגמה, אנחנו מתמקדים בהטיות לפי מגדר, גזע, מוצא אתני ודת, אבל מבצעים את הניתוח רק על נתונים ותוצאות של מודלים באנגלית. מידע נוסף זמין בבלוג של צוות המחקר של Google.

  • מומחיות מוגבלת בתחום מסוים: יכול להיות שלמודלים של AI גנרטיבי חסר הידע הנדרש כדי לספק תשובות מדויקות ומפורטות בנושאים טכניים או מאוד ספציפיים, ולכן הם עלולים לספק מידע שטחי או שגוי. בתרחישי שימוש מורכבים ומיוחדים, צריך לכוונן את המודלים על סמך נתונים ספציפיים לתחום, וחייבת להיות השגחה משמעותית של בני אדם בהקשרים שיש בהם פוטנציאל להשפיע באופן משמעותי על זכויות הפרט.

  • אורך ומבנה של קלט ופלט: למודלים של AI גנרטיבי יש מגבלה על מספר הטוקנים של הקלט והפלט. אם הקלט או הפלט חורגים מהמגבלה הזו, מסווגי הבטיחות שלנו לא מופעלים, מה שעלול להוביל בסופו של דבר לביצועים נמוכים של המודל. המודלים שלנו נועדו לטפל במגוון רחב של פורמטים של טקסט, אבל הביצועים שלהם יכולים להיפגע אם נתוני הקלט הם בעלי מבנה לא רגיל או מורכב.

כדי להשתמש בטכנולוגיה הזו בצורה בטוחה ואחראית, חשוב גם לקחת בחשבון סיכונים אחרים שספציפיים לתרחיש השימוש, למשתמשים ולסביבה העסקית שלכם, בנוסף לאמצעי ההגנה הטכניים המובנים.

מומלץ לבצע את השלבים הבאים:

  1. הערכת סיכוני האבטחה של האפליקציה.
  2. לבצע בדיקות בטיחות שמתאימות לתרחיש השימוש.
  3. אם צריך, מגדירים מסנני בטיחות.
  4. לבקש משוב מהמשתמשים ולעקוב אחרי התוכן.

דיווח על התנהלות פוגעת

אתם יכולים לדווח על חשד להתנהלות פוגעת בשירות או על תוכן שנוצר ומכיל חומר בלתי הולם או מידע לא מדויק באמצעות הטופס הבא: דיווח על חשד להתנהלות פוגעת ב- Google Cloud.

מקורות מידע נוספים