הדף הזה רלוונטי ל-Apigee ול-Apigee Hybrid.
לעיון במסמכי התיעוד של
Apigee Edge
המדיניות SanitizeModelResponse מגנה על לקוחות AI מפני תוכן פוגעני או מעליב על ידי ניקוי התשובות של מודלים של AI גנרטיבי. המדיניות משתמשת ב-Model Armor כדי להעריך את התשובות של המודלים ולזהות תוכן פוגעני או מעליב, וכך מאפשרת הגנה מקורית ללקוחות AI ולעומסי עבודה באמצעות Apigee. Model Armor הוא שירות שמציע אמצעי אבטחה ובטיחות של AI כדי לצמצם את הסיכונים שקשורים למודלים גדולים של שפה (LLM). Google Cloud
המדיניות הזו משמשת בשילוב עם המדיניות SanitizeUserPrompt.
המדיניות הזו היא מדיניות שניתנת להרחבה, והשימוש בה עשוי להשפיע על העלויות או על הניצול, בהתאם לרישיון שלכם ל-Apigee. למידע על סוגי מדיניות והשלכות השימוש, אפשר לעיין במאמר בנושא סוגי מדיניות.
לפני שמתחילים
לפני שמשתמשים במדיניות SanitizeModelResponse, צריך לבצע את המשימות הבאות:
- יוצרים תבנית הגנה מוגברת על המודל. השלב הזה צריך להתבצע לפני שיוצרים מדיניות SanitizeModelResponse.
- מגדירים את נקודת הקצה ל-API לשירות הגנה מוגברת על המודל.
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות להחלה ולשימוש במדיניות SanitizeModelResponse, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בחשבון השירות שבו אתם משתמשים כדי לפרוס פרוקסי של Apigee:
- משתמש בהגנה מוגברת על המודל (
roles/modelarmor.user) - צפייה ב-Model Armor (
roles/modelarmor.viewer)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
הפעלת ממשקי ה-API
מפעילים את ממשקי הגנה מוגברת על המודל API.
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאה serviceusage.services.enable. איך מקצים תפקידים
רכיב <SanitizeModelResponse>
הגדרת מדיניות SanitizeModelResponse.
| ערך ברירת המחדל | מידע נוסף מופיע בכרטיסייה מדיניות ברירת המחדל שבהמשך |
| חובה? | חובה |
| סוג | אובייקט מורכב |
| רכיב אב | לא רלוונטי |
| רכיבי צאצא |
<DisplayName><IgnoreUnresolvedVariables><TemplateName><UserPromptSource><LLMResponseSource> |
רכיב <SanitizeModelResponse> משתמש בתחביר הבא:
תחביר
<SanitizeModelResponse async="false" continueOnError="false" enabled="true" name="sanitize-response">
<IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
<DisplayName>sanitize-response-sample</DisplayName>
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>
<UserPromptSource>{jsonPath('$.contents[-1].parts[-1].text',request.content,true)}</UserPromptSource>
<LLMResponseSource>{jsonPath('$.candidates[-1].content.parts',response.content,true)}</LLMResponseSource>
</SanitizeModelResponse>מדיניות ברירת המחדל
בדוגמה הבאה מוצגות הגדרות ברירת המחדל כשמוסיפים מדיניות SanitizeModelResponse לזרימת הבקשות בממשק המשתמש של Apigee:
<SanitizeModelResponse async="false" continueOnError="false" enabled="true" name="sanitize-response">
<IgnoreUnresolvedVariables>true</IgnoreUnresolvedVariables>
<DisplayName>sanitize-response-sample</DisplayName>
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>
<UserPromptSource>{jsonPath('$.contents[-1].parts[-1].text',request.content,true)}</UserPromptSource>
<LLMResponseSource>{jsonPath('$.candidates[-1].content.parts',response.content,true)}</LLMResponseSource>
</SanitizeModelResponse>כשמוסיפים מדיניות חדשה של SanitizeModelResponse באמצעות ממשק המשתמש של Apigee, התבנית מכילה placeholders לכל הפעולות האפשריות. בהמשך מפורט מידע על האלמנטים הנדרשים.
לרכיב הזה יש את המאפיינים הבאים שמשותפים לכל המדיניות:
| מאפיין | ברירת מחדל | חובה? | תיאור |
|---|---|---|---|
name |
לא רלוונטי | חובה |
השם הפנימי של המדיניות. הערך של מאפיין אפשר להשתמש ברכיב |
continueOnError |
FALSE | אופציונלי | מגדירים את הערך false כדי להחזיר שגיאה אם המדיניות נכשלת. זו התנהגות צפויה ברוב המקרים. הגדרה ל-true מאפשרת להמשיך את הביצוע של התהליך גם אחרי שמדיניות נכשלת. מאמרים קשורים:
|
enabled |
TRUE | אופציונלי | מגדירים את הערך true כדי לאכוף את המדיניות, או את הערך false כדי להשבית את המדיניות. המדיניות לא נאכפת גם אם היא עדיין משויכת לזרימה. |
async |
FALSE | הוצא משימוש | המאפיין הזה הוצא משימוש. |
בטבלה הבאה מפורטים רכיבי המשנה של <SanitizeModelResponse>:
| רכיב צאצא | חובה? | תיאור |
|---|---|---|
<DisplayName> |
אופציונלי | שם המדיניות. |
<IgnoreUnresolvedVariables> |
אופציונלי | המדיניות קובעת אם העיבוד ייפסק אם המשתנה שמשמש לשם התבנית או למטען הייעודי (payload) של הגנה מוגברת על המודל לא נפתר. |
<TemplateName> |
חובה | תבנית הגנה מוגברת על המודל ששימשה לניקוי התשובה של ה-LLM.
אפשר להשתמש בתבנית לערך הזה באמצעות משתני הזרימה הבאים של Apigee: projects/{organization.name}/locations/{system.region.name}/templates/{id} |
<UserPromptSource> |
חובה | המיקום של מטען הייעודי (payload) של טקסט הנחיית המשתמש לחילוץ. המערכת תומכת רק בערכי טקסט של מחרוזת.
השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של JSON Path. {jsonpath('$.contents[-1].parts[-1].text',request.content,false)} |
<LLMResponseSource> |
חובה | המיקום של מטען הייעודי (payload) של טקסט התשובה של מודל שפה גדול (LLM) שרוצים לחלץ. יש תמיכה רק בערכי טקסט מסוג מחרוזת.
השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של JSON Path. {jsonpath('$.input.prompt.text',request.content,false)} |
הפניה לרכיב צאצא
בקטע הזה מתוארים רכיבי הבן של <SanitizeModelResponse>.
<DisplayName>
אפשר להשתמש במאפיין הזה בנוסף למאפיין name כדי לתת למדיניות שם אחר, שנשמע יותר טבעי, ב-UI של עורך ה-proxy לניהול.
הרכיב <DisplayName> משותף לכל סוגי המדיניות.
| ערך ברירת המחדל | לא רלוונטי |
| חובה? | זה שינוי אופציונלי. אם לא מציינים את <DisplayName>, המערכת משתמשת בערך של מאפיין name של המדיניות. |
| סוג | String |
| רכיב אב | <PolicyElement> |
| רכיבי צאצא | ללא |
רכיב <DisplayName> משתמש בתחביר הבא:
תחביר
<PolicyElement> <DisplayName>POLICY_DISPLAY_NAME</DisplayName> ... </PolicyElement>
דוגמה
<PolicyElement> <DisplayName>My Validation Policy</DisplayName> </PolicyElement>
לרכיב <DisplayName> אין מאפיינים או רכיבי צאצא.
<IgnoreUnresolvedVariables>
קובעת אם העיבוד ייפסק כשמשתנה לא נפתר. הגדרה לערך
true כדי להתעלם ממשתנים שלא נפתרו ולהמשיך בעיבוד.
| ערך ברירת המחדל | לא נכון |
| חובה? | אופציונלי |
| סוג | בוליאני |
| רכיב אב |
<SanitizeModelResponse>
|
| רכיבי צאצא | ללא |
<TemplateName>
תבנית הגנה מוגברת על המודל.
| ערך ברירת המחדל | לא רלוונטי |
| חובה? | חובה |
| סוג | String |
| רכיב אב |
<SanitizeModelResponse>
|
| רכיבי צאצא | ללא |
רכיב <TemplateName> משתמש בתחביר הבא:
תחביר
<ModelArmor>
<TemplateName>projects/{project}/locations/{location}/templates/{template-name}</TemplateName>
</ModelArmor>דוגמה
בדוגמה הזו נעשה שימוש במשתני זרימה של Apigee כדי לאכלס את המידע הנדרש.
<ModelArmor> <TemplateName>projects/{organization.name}/locations/{system.region.name}/templates/{id}</TemplateName> </ModelArmor>
<UserPromptSource>
המיקום של מטען הייעודי (payload) של טקסט הנחיית המשתמש לחילוץ. המערכת תומכת רק בערכי טקסט של מחרוזת.
השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של נתיב JSON. לדוגמה:
{jsonpath('$.input.prompt.text',request.content,false)}
| ערך ברירת המחדל | {jsonPath('$.contents[-1].parts[-1].text',request.content,true)} |
| חובה? | חובה |
| סוג | String |
| רכיב אב |
<SanitizeModelResponse>
|
| רכיבי צאצא | ללא |
<LLMResponseSource>
המיקום של מטען הייעודי (payload) של תגובת ה-LLM שצריך לחלץ. נתמכים רק ערכי טקסט מסוג מחרוזת.
השדה הזה תומך בתחביר של תבניות הודעות ב-Apigee, כולל שימוש ב משתנים או בפונקציות של נתיב JSON. לדוגמה:
{jsonpath('$.input.prompt.text',request.content,false)}
| ערך ברירת המחדל | {jsonPath($.candidates[-1].content.parts,response.content,true)} |
| חובה? | חובה |
| סוג | String |
| רכיב אב |
<SanitizeModelResponse>
|
| רכיבי צאצא | ללא |
משתנים בתהליך
אפשר להשתמש במשתני Flow כדי להגדיר התנהגות דינמית בזמן ריצה למדיניות ול-Flows, על סמך כותרות HTTP או תוכן ההודעה, או ההקשר שזמין ב-Flow. מידע נוסף על משתני Flow זמין במאמר הפניה למשתני Flow.
המדיניות הזו מספקת את קבוצת משתני הזרימה הבאה שהם לקריאה בלבד במהלך ההרצה. אפשר להשתמש במשתני הזרימה האלה עם מדיניות DataCapture כדי ליצור דוחות ניתוח בהתאמה אישית. מידע נוסף זמין במאמר בנושא איסוף נתוני לקוחות בהתאם למדיניות בנושא איסוף נתונים.
| שם המשתנה | תיאור |
|---|---|
SanitizeModelResponse.POLICY_NAME.templateUsed |
מציינת באיזו תבנית של שריון המודל נעשה שימוש. לדוגמה:
projects/myproject/locations/us-west1/templates/mytemplate |
SanitizeModelResponse.POLICY_NAME.userPrompt |
מציינת את תוכן ההנחיה שמשמש לקריאה ל-Model Armor כדי לבצע סניטציה של התוכן. |
SanitizeModelResponse.POLICY_NAME.modelResponse |
מציין את תוכן התשובה של ה-LLM שמשמש לקריאה ל-הגנה מוגברת על המודל כדי לבצע סניטציה של התוכן. |
SanitizeModelResponse.POLICY_NAME.responseFromModelArmor |
מציין את תגובת ה-JSON מ-Model Armor. הגנה מוגברת על המודל. |
SanitizeModelResponse.POLICY_NAME.filterMatchState |
מציין אם המסנן הותאם. הערכים התקפים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.invocationResult |
שדה שמציין את התוצאה של הקריאה, ללא קשר לסטטוס ההתאמה. הוא יכול לכלול את הפרטים הבאים:
|
SanitizeModelResponse.POLICY_NAME.raiFilterResult.executionState |
תוצאת ההרצה של מסנן ה-Rai. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.raiFilterResult.matchState |
מצב ההתאמה של מסנן ה-Rai. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.sdpFilterResult.inspectResult.executionState |
מצב ההפעלה של תוצאת הבדיקה של מסנן ה-SDP. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.sdpFilterResult.inspectResult.matchState |
מצב ההתאמה של תוצאת הבדיקה של מסנן ה-SDP. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.sdpFilterResult.deidentifyResult.executionState |
מצב ההפעלה של התוצאה של סינון ה-SDP לביטול הזיהוי. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.sdpFilterResult.deidentifyResult.matchState |
מצב ההתאמה של תוצאת ביטול הזיהוי של מסנן ה-SDP. הערכים התקפים כוללים את MATCH_FOUND ואת NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.piAndJailbreakFilterResult.executionState |
מצב ההפעלה של תוצאות הסינון של הזרקת הנחיות ופריצת הגבלות. הערכים התקפים כוללים את EXECUTION_SUCCESS ואת EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.piAndJailbreakFilterResult.matchState |
מצב ההתאמה של תוצאות הסינון של הזרקת הנחיות ופריצת הגבלות. ערכים תקינים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.csamFilterFilterResult.executionState |
מצב ההפעלה של מסנן CSAM. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.csamFilterFilterResult.matchState |
מצב ההתאמה של מסנן CSAM. הערכים התקפים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.maliciousUriFilterResult.executionState |
מצב ההפעלה של מסנן URI זדוני. הערכים התקפים כוללים EXECUTION_SUCCESS ו-EXECUTION_SKIPPED. |
SanitizeModelResponse.POLICY_NAME.maliciousUriFilterResult.matchState |
מצב התאמה של מסנן URI זדוני. ערכים תקינים כוללים MATCH_FOUND ו-NO_MATCH_FOUND. |
SanitizeModelResponse.POLICY_NAME.sanitizationMetadata.errorCode |
קוד שגיאה מותאם אישית שמוחלף אם הוא מופיע בתגובה של הגנה מוגברת על המודל. |
SanitizeModelResponse.POLICY_NAME.sanitizationMetadata.errorMessage |
קוד שגיאה מותאם אישית שמוחלף אם הוא מופיע בתגובה של הגנה מוגברת על המודל. |
SanitizeModelResponse.POLICY_NAME.csamFilterMatched |
ערך בוליאני שמציין אם המסנן של CSAM התאים. |
SanitizeModelResponse.POLICY_NAME.maliciousURIs |
רשימה מצורפת של מזהי URI זדוניים שזוהו על ידי המסנן של מזהי URI זדוניים. |
SanitizeModelResponse.POLICY_NAME.maliciousURIsDetected |
ערך בוליאני שמציין אם מסנן ה-URI הזדוני תאם. |
SanitizeModelResponse.POLICY_NAME.matchesFound |
ערך בוליאני שמציין אם יש התאמה לאחד מהמסננים. |
SanitizeModelResponse.POLICY_NAME.promptInjectionDetected |
ערך בוליאני שמציין אם המסנן של הזרקת הנחיות מצא התאמה. |
SanitizeModelResponse.POLICY_NAME.promptInjectionConfidence |
רמת המהימנות של זיהוי הזרקת הנחיות. |
SanitizeModelResponse.POLICY_NAME.raiMatchesFound |
ערך בוליאני שמציין אם המסנן של RAI התאים. |
SanitizeModelResponse.POLICY_NAME.requestSentToModelArmor |
ערך בוליאני שמציין אם בקשה נשלחה להגנה מוגברת על המודל. |
SanitizeModelResponse.POLICY_NAME.sanitizeOperation |
מציינת את הפעולה שמבוצעת על ידי המדיניות. הערכים התקפים כוללים SANITIZE_USER_PROMPT
ו-SANITIZE_MODEL_RESPONSE. |
הפניה לשגיאה
בקטע הזה מתוארים קודי השגיאות והודעות השגיאה שמוחזרים, ומשתני השגיאה שמוגדרים על ידי Apigee באופן ספציפי למדיניות <SanitizeModelResponse>. חשוב להכיר את המידע הזה אם מפתחים כללי שגיאה לטיפול בשגיאות. למידע נוסף, אפשר לעיין במאמרים מה שחשוב לדעת על שגיאות במדיניות וטיפול בשגיאות.
שגיאות זמן ריצה
| קוד תקלה | סטטוס HTTP | מטרה |
|---|---|---|
steps.sanitize.model.response.FilterMatched |
400 |
השגיאה הזו מתרחשת אם ההנחיה למשתמש לא עוברת את הבדיקה של תבנית הגנה מוגברת על המודל. |
steps.sanitize.model.response.SanitizationResponseParsingFailed |
500 |
השגיאה הזו מתרחשת אם אי אפשר לנתח את התגובה של Model Armor. |
steps.sanitize.model.response.FailedToExtractUserPrompt |
500 |
השגיאה הזו מתרחשת אם חילוץ ההנחיה האוטומטית למשתמש עבור ערך ברירת המחדל נכשל. |
steps.sanitize.model.response.FailedToExtractLLMResponse |
500 |
השגיאה הזו מתרחשת אם חילוץ התשובה האוטומטית של המודל לערך ברירת המחדל נכשל. |
steps.sanitize.model.response.InternalError |
500 |
השגיאה הזו מתרחשת אם יש שגיאת שרת פנימית. |
steps.sanitize.model.response.ModelArmorTemplateNameExtractionFailed |
500 |
השגיאה הזו מתרחשת אם אי אפשר לפתור את שם התבנית. |
steps.sanitize.model.response.AuthenticationFailure |
500 |
השגיאה הזו מתרחשת אם לחשבון השירות אין הרשאה לקרוא ל-API של הגנה מוגברת על המודל. |
steps.sanitize.model.response.ModelArmorAPIFailed |
500 |
השגיאה הזו מתרחשת אם Model Armor API מחזיר שגיאה. |
steps.sanitize.model.response.ModelArmorCalloutError |
500 |
השגיאה הזו מתרחשת אם הקריאה ל-API של הגנה מוגברת על המודל נכשלת. |
steps.sanitize.modelarmor.ServiceUnavailable |
500 |
השגיאה הזו מתרחשת אם שירות הגנה מוגברת על המודל לא זמין. |
שגיאות בהטמעה
השגיאות האלה יכולות להתרחש כשפורסים שרת proxy שמכיל את המדיניות הזו.
| שם השגיאה | מטרה |
|---|---|
The ModelArmor/TemplateName element is required. |
השגיאה הזו מתרחשת אם הרכיב <TemplateName> ב-<ModelArmor> לא קיים. |
The TemplateName element value is required. |
השגיאה הזו מתרחשת אם הערך של <TemplateName> ריק. |
משתני תקלות
המשתנים האלה מוגדרים כשהמדיניות הזו מפעילה שגיאה בזמן הריצה. מידע נוסף על שגיאות שקשורות למדיניות
| משתנים | כאשר: | דוגמה |
|---|---|---|
fault.name="FAULT_NAME" |
FAULT_NAME הוא שם התקלה, כפי שמופיע בטבלה Runtime errors שלמעלה. שם התקלה הוא החלק האחרון של קוד התקלה. | fault.name Matches "UnresolvedVariable" |
SanitizeModelResponse.POLICY_NAME.failed |
POLICY_NAME הוא השם שהמשתמש הגדיר למדיניות שגרמה לשגיאה. | SanitizeModelResponse.sanitize-response.failed = true |
דוגמה לתגובת שגיאה
{ "fault": { "faultstring": "SanitizeModelResponse[sanitize-response]: unable to resolve variable [variable_name]", "detail": { "errorcode": "steps.sanitizemodelresponse.UnresolvedVariable" } } }
דוגמה לכלל שגיאה
<FaultRule name="SanitizeModelResponse Faults">
<Step>
<Name>SMR-CustomSetVariableErrorResponse</Name>
<Condition>(fault.name = "SetVariableFailed")</Condition>
</Step>
<Condition>(sanitizemodelresponse.failed = true)</Condition>
</FaultRule>קוד שגיאה והודעות שגיאה של תבנית הגנה מוגברת על המודל
תבנית הגנה מוגברת על המודל תומכת בביטול קודי שגיאה והודעות שגיאה שמוחזרים על ידי בקשות API של מדיניות SanitizeModelResponse. אם המשתמש מגדיר את השינויים מברירת המחדל, קודי השגיאה והודעות השגיאה של הגנה מוגברת על המודל יאכלסו את משתני הזרימה.
לדוגמה, תגובה עם קודי שגיאה והודעות של הגנה מוגברת על המודל יכולה להיראות כך:
{ "sanitizationResult": { "filterMatchState": "MATCH_FOUND", "filterResults": {...}, "sanitizationMetadata": { "errorCode": "890", "errorMessage": "get out" }, "invocationResult": "SUCCESS" } }
סכימות
כל סוג מדיניות מוגדר על ידי סכימת XML (.xsd). סכימות מדיניות זמינות ב-GitHub.