הדף הזה רלוונטי ל-Apigee ול-Apigee Hybrid.
לעיון במסמכי התיעוד של
Apigee Edge
המדיניות SanitizeUserPrompt מגנה על אפליקציות AI מפני תוכן פוגעני על ידי ניקוי הנחיות למשתמשים שנשלחות למודלים של AI גנרטיבי. המדיניות משתמשת ב-Model Armor כדי להעריך הנחיות של משתמשים לתוכן מזיק, וכך מאפשרת הגנה מקורית על עומסי עבודה של AI באמצעות Apigee. Model Armor הוא שירות שמציע אמצעי אבטחה ובטיחות ל-AI, כדי לצמצם את הסיכונים שקשורים למודלים גדולים של שפה (LLM). Google Cloud
המדיניות הזו פועלת בשילוב עם המדיניות SanitizeModelResponse.
המדיניות הזו היא מדיניות שניתנת להרחבה, והשימוש בה עשוי להשפיע על העלויות או על הניצול, בהתאם לרישיון שלכם ל-Apigee. למידע על סוגי מדיניות והשלכות השימוש, אפשר לעיין במאמר בנושא סוגי מדיניות.
לפני שמתחילים
לפני שמשתמשים במדיניות SanitizeUserPrompt, צריך לבצע את המשימות הבאות:
- יוצרים תבנית הגנה מוגברת על המודל. צריך להשלים את השלב הזה לפני שיוצרים מדיניות SanitizeUserPrompt.
- מגדירים את נקודת הקצה ל-API לשירות הגנה מוגברת על המודל.
- יוצרים מדיניות SanitizeModelResponse. צריך להשלים את המשימה הזו לפני שמפעילים את המדיניות SanitizeUserPrompt.
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות להחלה ולשימוש במדיניות SanitizeUserPrompt, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בחשבון השירות שבו אתם משתמשים כדי לפרוס פרוקסי של Apigee:
- משתמש בהגנה מוגברת על המודל (
roles/modelarmor.user) - צפייה ב-Model Armor (
roles/modelarmor.viewer)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
הפעלת ממשקי ה-API
מפעילים את הגנה מוגברת על המודל API.
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאה serviceusage.services.enable. איך מקצים תפקידים
רכיב <SanitizeUserPrompt>
הגדרת מדיניות SanitizeUserPrompt.
| ערך ברירת המחדל | מידע נוסף מופיע בכרטיסייה מדיניות ברירת המחדל שבהמשך |
| חובה? | חובה |
| סוג | אובייקט מורכב |
| רכיב אב | לא רלוונטי |
| רכיבי צאצא |
<DisplayName><IgnoreUnresolvedVariables><TemplateName><UserPromptSource> |
רכיב <SanitizeUserPrompt> משתמש בתחביר הבא:
תחביר
<SanitizeUserPrompt async="false" continueOnError="false" enabled="true" name="sanitize-text">
<IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
<DisplayName>Sanitize-Text-sample</DisplayName>
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>
<UserPromptSource>{jsonPath('$.contents[-1].parts[-1].text',request.content,true)}</UserPromptSource>
</SanitizeUserPrompt>מדיניות ברירת המחדל
הדוגמה הבאה מציגה את הגדרות ברירת המחדל כשמוסיפים מדיניות SanitizeUserPrompt (ניקוי הנחיות למשתמש) לזרימת הבקשות בממשק המשתמש של Apigee:
<SanitizeUserPrompt async="false" continueOnError="false" enabled="true" name="sanitize-text">
<IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
<DisplayName>Sanitize-Text-sample</DisplayName>
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>
<UserPromptSource>{jsonPath('$.contents[-1].parts[-1].text',request.content,true)}</UserPromptSource>
</SanitizeUserPrompt>כשמוסיפים מדיניות חדשה של SanitizeUserPrompt באמצעות ממשק המשתמש של Apigee, התבנית מכילה placeholders לכל הפעולות האפשריות. בהמשך מפורט מידע על האלמנטים הנדרשים.
לרכיב הזה יש את המאפיינים הבאים שמשותפים לכל המדיניות:
| מאפיין | ברירת מחדל | חובה? | תיאור |
|---|---|---|---|
name |
לא רלוונטי | חובה |
השם הפנימי של המדיניות. הערך של מאפיין אפשר להשתמש ברכיב |
continueOnError |
FALSE | אופציונלי | מגדירים את הערך false כדי להחזיר שגיאה אם המדיניות נכשלת. זו התנהגות צפויה ברוב המקרים. הגדרה ל-true מאפשרת להמשיך את הביצוע של התהליך גם אחרי שמדיניות נכשלת. מאמרים קשורים:
|
enabled |
TRUE | אופציונלי | מגדירים את הערך true כדי לאכוף את המדיניות, או את הערך false כדי להשבית את המדיניות. המדיניות לא נאכפת גם אם היא עדיין משויכת לזרימה. |
async |
FALSE | הוצא משימוש | המאפיין הזה הוצא משימוש. |
בטבלה הבאה מפורטים רכיבי המשנה של <SanitizeUserPrompt>:
| רכיב צאצא | חובה? | תיאור |
|---|---|---|
<DisplayName> |
אופציונלי | שם המדיניות. |
<IgnoreUnresolvedVariables> |
אופציונלי | המדיניות קובעת אם העיבוד ייפסק אם המשתנה שמשמש לשם התבנית או למטען הייעודי (payload) של הגנה מוגברת על המודל לא נפתר. |
<ModelArmor> |
חובה | מכיל את המידע הנדרש לציון תבנית הגנה מוגברת על המודל. |
<UserPromptSource> |
אופציונלי | המיקום של מטען הייעודי (payload) של טקסט הנחיית המשתמש לחילוץ. המערכת תומכת רק בערכי טקסט של מחרוזת.
השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של JSON Path. לדוגמה: {jsonpath('$.input.prompt.text',request.content,false)} |
דוגמה
בקטע הזה מופיעה דוגמה לשימוש ב-<SanitizeUserPrompt>.
בדוגמה הזו נעשה שימוש בכל ערכי ברירת המחדל לזיהוי מודלים ולחילוץ הנחיות:
<SanitizeUserPrompt async="false" continueOnError="false" enabled="true" name="sanitize-text">
<IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
<DisplayName>Sanitize-Text-sample</DisplayName>
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>
</SanitizeUserPrompt>הפניה לרכיב צאצא
בקטע הזה מתוארים רכיבי הבן של <SanitizeUserPrompt>.
<DisplayName>
אפשר להשתמש במאפיין הזה בנוסף למאפיין name כדי לתת למדיניות שם אחר, שנשמע יותר טבעי, ב-UI של עורך ה-proxy לניהול.
הרכיב <DisplayName> משותף לכל סוגי המדיניות.
| ערך ברירת המחדל | לא רלוונטי |
| חובה? | זה שינוי אופציונלי. אם לא מציינים את <DisplayName>, המערכת משתמשת בערך של מאפיין name של המדיניות. |
| סוג | String |
| רכיב אב | <PolicyElement> |
| רכיבי צאצא | ללא |
רכיב <DisplayName> משתמש בתחביר הבא:
תחביר
<PolicyElement> <DisplayName>POLICY_DISPLAY_NAME</DisplayName> ... </PolicyElement>
דוגמה
<PolicyElement> <DisplayName>My Validation Policy</DisplayName> </PolicyElement>
לרכיב <DisplayName> אין מאפיינים או רכיבי צאצא.
<IgnoreUnresolvedVariables>
קובעת אם העיבוד ייפסק כשמשתנה לא נפתר. הגדרה לערך
true כדי להתעלם ממשתנים שלא נפתרו ולהמשיך בעיבוד.
| ערך ברירת המחדל | לא נכון |
| חובה? | אופציונלי |
| סוג | בוליאני |
| רכיב אב |
<SanitizeUserPrompt>
|
| רכיבי צאצא | ללא |
<ModelArmor>
מכיל את המידע הנדרש לציון תבנית הגנה מוגברת על המודל.
| ערך ברירת המחדל | לא רלוונטי |
| חובה? | חובה |
| סוג | String |
| רכיב אב | |
| רכיבי צאצא |
<TemplateName>
|
רכיב <ModelArmor> משתמש בתחביר הבא:
תחביר
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>דוגמה
בדוגמה הזו נעשה שימוש במשתני זרימה של Apigee כדי לאכלס את המידע הנדרש.
<ModelArmor> <TemplateName>projects/{organization.name}/locations/{system.region.name}/templates/{id}</TemplateName> </ModelArmor>
בטבלה הבאה מופיע תיאור כללי של רכיבי המשנה של <ModelArmor>.
| רכיב צאצא | חובה? | תיאור |
|---|---|---|
<TemplateName> |
חובה | String תבנית הגנה מוגברת על המודל שמשמשת לניקוי ההנחיה למשתמש. אפשר להשתמש בתבנית לערך הזה באמצעות משתני הזרימה הבאים של Apigee: projects/{organization.name}/locations/{system.region.name}/templates/{id} |
<UserPromptSource>
המיקום של מטען הייעודי (payload) שבו נמצא הטקסט של הנחיית המשתמש שרוצים לחלץ. השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של נתיב JSON. לדוגמה:
{jsonpath('$.input.prompt.text',request.content,false)}
| ערך ברירת המחדל | {jsonPath('$.contents[-1].parts[-1].text',request.content,true)} |
| חובה? | אופציונלי |
| סוג | String |
| רכיב אב |
<SanitizeUserPrompt>
|
| רכיבי צאצא | ללא |
משתנים בתהליך
משתני Flow מגדירים התנהגות דינמית בזמן ריצה עבור מדיניות ו-Flows, על סמך כותרות HTTP או תוכן הודעה, או ההקשר שזמין ב-Flow. מידע נוסף על משתני זרימה זמין במאמר חומר עזר בנושא משתני זרימה.
המדיניות הזו מספקת את קבוצת משתני הזרימה הבאה שהם לקריאה בלבד במהלך ההרצה. אפשר להשתמש במשתני הזרימה האלה עם מדיניות DataCapture כדי ליצור דוחות ניתוח בהתאמה אישית. מידע נוסף זמין במאמר בנושא איסוף נתוני לקוחות בהתאם למדיניות בנושא איסוף נתונים.
| שם המשתנה | תיאור |
|---|---|
SanitizeUserPrompt.POLICY_NAME.templateUsed |
מציינת באיזו תבנית של שריון המודל נעשה שימוש. לדוגמה:
projects/myproject/locations/us-west1/templates/mytemplate |
SanitizeUserPrompt.POLICY_NAME.userPrompt |
מציינת את תוכן ההנחיה שמשמש לקריאה ל-Model Armor כדי לבצע סניטציה של התוכן. |
SanitizeUserPrompt.POLICY_NAME.modelResponse |
מציין את תוכן התשובה של ה-LLM שמשמש לקריאה ל-הגנה מוגברת על המודל כדי לבצע סניטציה של התוכן. |
SanitizeUserPrompt.POLICY_NAME.responseFromModelArmor |
מציין את תגובת ה-JSON מ-Model Armor. |
SanitizeUserPrompt.POLICY_NAME.filterMatchState |
קובעת אם המסנן תאם. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.invocationResult |
שדה שמציין את התוצאה של הקריאה, ללא קשר לסטטוס ההתאמה. הוא יכול לכלול את הפרטים הבאים:
|
SanitizeUserPrompt.POLICY_NAME.raiFilterResult.executionState |
תוצאת ההרצה של מסנן ה-Rai. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.raiFilterResult.matchState |
מצב ההתאמה של מסנן ה-Rai. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.sdpFilterResult.inspectResult.executionState |
מצב ההפעלה של תוצאת הבדיקה של מסנן ה-SDP. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.sdpFilterResult.inspectResult.matchState |
מצב ההתאמה של תוצאת הבדיקה של מסנן ה-SDP. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.sdpFilterResult.deidentifyResult.executionState |
מצב ההפעלה של התוצאה של סינון ה-SDP לביטול הזיהוי. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.sdpFilterResult.deidentifyResult.matchState |
מצב ההתאמה של תוצאת ביטול הזיהוי של מסנן ה-SDP. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.piAndJailbreakFilterResult.executionState |
מצב ההפעלה של תוצאות הסינון של הזרקת הנחיות ופריצת הגבלות. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.piAndJailbreakFilterResult.matchState |
מצב ההתאמה של תוצאות הסינון של הזרקת הנחיות ופריצת הגבלות. ערכים תקינים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.csamFilterFilterResult.executionState |
מצב ההפעלה של מסנן CSAM. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.csamFilterFilterResult.matchState |
מצב ההתאמה של מסנן CSAM. הערכים התקפים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.maliciousUriFilterResult.executionState |
מצב ההפעלה של מסנן URI זדוני. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeUserPrompt.POLICY_NAME.maliciousUriFilterResult.matchState |
מצב התאמה של מסנן URI זדוני. ערכים תקינים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeUserPrompt.POLICY_NAME.sanitizationMetadata.errorCode |
קוד שגיאה מותאם אישית שמוחלף אם הוא מופיע בתגובה של הגנה מוגברת על המודל. |
SanitizeUserPrompt.POLICY_NAME.sanitizationMetadata.errorMessage |
קוד שגיאה מותאם אישית שמוחלף אם הוא מופיע בתגובה של הגנה מוגברת על המודל. |
SanitizeUserPrompt.POLICY_NAME.csamFilterMatched |
ערך בוליאני שמציין אם המסנן של CSAM התאים. |
SanitizeUserPrompt.POLICY_NAME.maliciousURIs |
רשימה מצורפת של מזהי URI זדוניים שזוהו על ידי המסנן של מזהי URI זדוניים. |
SanitizeUserPrompt.POLICY_NAME.maliciousURIsDetected |
ערך בוליאני שמציין אם מסנן ה-URI הזדוני תאם. |
SanitizeUserPrompt.POLICY_NAME.matchesFound |
ערך בוליאני שמציין אם יש התאמה לאחד מהמסננים. |
SanitizeUserPrompt.POLICY_NAME.promptInjectionDetected |
ערך בוליאני שמציין אם המסנן של הזרקת הנחיות מצא התאמה. |
SanitizeUserPrompt.POLICY_NAME.promptInjectionConfidence |
רמת המהימנות של זיהוי הזרקת הנחיות. |
SanitizeUserPrompt.POLICY_NAME.raiMatchesFound |
ערך בוליאני שמציין אם המסנן של RAI התאים. |
SanitizeUserPrompt.POLICY_NAME.requestSentToModelArmor |
ערך בוליאני שמציין אם בקשה נשלחה להגנה מוגברת על המודל. |
SanitizeUserPrompt.POLICY_NAME.sanitizeOperation |
מציינת את הפעולה שמבוצעת על ידי המדיניות. הערכים התקפים כוללים SANITIZE_USER_PROMPT
ו-SANITIZE_MODEL_RESPONSE. |
הפניה לשגיאה
בקטע הזה מפורטים קודי התקלה והודעות השגיאה שמוחזרים מ-Apigee, ומשתני התקלה שמוגדרים על ידי Apigee למדיניות SanitizeUserPrompt. חשוב להכיר את המידע הזה אם מפתחים כללי תקלה לטיפול בתקלות. מידע נוסף זמין במאמרים מה שחשוב לדעת על שגיאות במדיניות וטיפול בתקלות.
שגיאות זמן ריצה
השגיאות האלה יכולות להתרחש כשהמדיניות מופעלת.
| קוד תקלה | סטטוס HTTP | מטרה |
|---|---|---|
steps.sanitize.user.prompt.response.FilterMatched |
400 |
השגיאה הזו מתרחשת אם ההנחיה למשתמש לא עוברת את הבדיקה של תבנית הגנה מוגברת על המודל. |
steps.sanitize.user.prompt.SanitizationResponseParsingFailed |
500 |
השגיאה הזו מתרחשת אם אי אפשר לנתח את התגובה של Model Armor. |
steps.sanitize.user.prompt.FailedToExtractUserPrompt |
500 |
השגיאה הזו מתרחשת אם חילוץ ההנחיה האוטומטית למשתמש עבור ערך ברירת המחדל נכשל. |
steps.sanitize.user.prompt.InternalError |
500 |
השגיאה הזו מתרחשת אם יש שגיאת שרת פנימית. |
steps.sanitize.modelarmor.ModelArmorTemplateNameExtractionFailed |
500 |
השגיאה הזו מתרחשת אם אי אפשר לפתור את שם התבנית. |
steps.sanitize.modelarmor.AuthenticationFailure |
500 |
השגיאה הזו מתרחשת אם לחשבון השירות אין הרשאה לקרוא ל-API של הגנה מוגברת על המודל. |
steps.sanitize.modelarmor.ModelArmorAPIFailed |
500 |
השגיאה הזו מתרחשת אם Model Armor API מחזיר שגיאה. |
steps.sanitize.modelarmor.ModelArmorCalloutError |
500 |
השגיאה הזו מתרחשת אם הקריאה ל-API של הגנה מוגברת על המודל נכשלת. |
steps.sanitize.modelarmor.ServiceUnavailable |
500 |
השגיאה הזו מתרחשת אם שירות הגנה מוגברת על המודל לא זמין. |
שגיאות בהטמעה
השגיאות האלה יכולות להתרחש כשפורסים שרת proxy שמכיל את המדיניות הזו.
| שם השגיאה | מטרה |
|---|---|
The ModelArmor/TemplateName element is required. |
השגיאה הזו מתרחשת אם הרכיב <TemplateName> ב-<ModelArmor> לא קיים. |
The TemplateName element value is required. |
השגיאה הזו מתרחשת אם הערך של <TemplateName> ריק. |
משתני תקלות
המשתנים האלה מוגדרים על ידי המדיניות הזו כשהיא מפעילה שגיאה בזמן ריצה. מידע נוסף זמין במאמר מה צריך לדעת על שגיאות שקשורות למדיניות.
| משתנים | כאשר: | דוגמה |
|---|---|---|
fault.name="FAULT_NAME" |
FAULT_NAME הוא שם התקלה, כפי שמופיע בטבלה Runtime errors שלמעלה. שם התקלה הוא החלק האחרון של קוד התקלה. | fault.name Matches "UnresolvedVariable" |
SanitizeUserPrompt.POLICY_NAME.failed |
POLICY_NAME הוא השם שהמשתמש הגדיר למדיניות שגרמה לשגיאה. | SanitizeUserPrompt.sanitize-prompt.failed = true |
דוגמה לתגובת שגיאה
{ "fault": { "faultstring": "SanitizeUserPrompt[sanitize-prompt]: unable to resolve variable [variable_name]", "detail": { "errorcode": "steps.sanitizeuserprompt.UnresolvedVariable" } } }
דוגמה לכלל שגיאה
<FaultRule name="SanitizeUserPrompt Faults">
<Step>
<Name>SUP-CustomSetVariableErrorResponse</Name>
<Condition>(fault.name = "SetVariableFailed")</Condition>
</Step>
<Condition>(sanitizeuserprompt.failed = true)</Condition>
</FaultRule>קוד שגיאה והודעות שגיאה של תבנית הגנה מוגברת על המודל
תבנית הגנה מוגברת על המודל תומכת בשינוי מברירת המחדל של קודי שגיאה והודעות שגיאה שמוחזרים על ידי בקשות API של מדיניות SanitizeUserPrompt. אם המשתמש מגדיר את השינויים מברירת המחדל, קודי השגיאה והודעות השגיאה של הגנה מוגברת על המודל מאכלסים את משתני הזרימה.
לדוגמה, תגובה עם קודי שגיאה והודעות של הגנה מוגברת על המודל יכולה להיראות כך:
{ "sanitizationResult": { "filterMatchState": "MATCH_FOUND", "filterResults": {...}, "sanitizationMetadata": { "errorCode": "890", "errorMessage": "get out" }, "invocationResult": "SUCCESS" } }
סכימות
כל סוג מדיניות מוגדר על ידי סכימת XML (.xsd). סכימות מדיניות זמינות ב-GitHub.