מסננים של Knowledge Assist

המסננים עוזרים לצמצם את החיפוש ולוודא שה-Knowledge Assist יפיק הצעות שימושיות. אפשר לסנן מסמכים ב-Datastore כדי לציין קטגוריה של מסמכים לעיון בKnowledge Assist גנרטיבי (GKA) ובKnowledge Assist גנרטיבי פרואקטיבי (PGKA). כדי לוודא שההצעות של PGKA יהיו מועילות ככל האפשר ולא יפגעו בעסק שלכם, אתם יכולים להתאים אישית את מסנני הבטיחות בתוכן שנוצר.

מסנני מסמכים

מסננים מסמכים של Knowledge Assist גם ב-GKA וגם ב-PGKA באמצעות SearchConfig.

שלב 1: הגדרת Datastore עם מטא-נתונים

ייבוא עם מטא-נתונים כדי ליצור Datastore עבור GKA ו-PGKA. צריך לספק מטא-נתונים בתור קובץ או קבצים בפורמט JSONL, שנמצאים בתיקייה ברמה גבוהה יותר של התוכן שמשמש לייבוא.

  1. פועלים לפי השלבים בדף של כלי Datastore כדי להוסיף Datastore לסוכן.
  2. בדף של אפליקציות AI, לוחצים על מאגרי נתונים > + יצירת מאגר נתונים.
  3. עוברים אל Cloud Storage ולוחצים על בחירה.
  4. לוחצים על קובץ, ואז מזינים את הנתיב לקובץ ב-Cloud Storage או לוחצים על עיון כדי לבחור את הקובץ.
  5. עוברים אל איזה סוג נתונים מייבאים? ובוחרים באפשרות מסמכים לא מובנים מקושרים (JSONL עם מטא-נתונים).
  6. עוברים אל אפשרויות ייבוא נתונים ובוחרים באפשרות מלא.
  7. לוחצים על Import.
  8. אחרי שיוצרים את מאגר הנתונים, אפשר לראות את הטבלה Documents. בטבלה מפורטים כל המסמכים שלכם עם הפרטים הבאים.
    • מזהה
    • קישור ל-URI
    • סטטוס האינדקס
    • פעולות
  9. כדי לבדוק את המאפיינים של מסמך, לוחצים על הצגת המסמך.

הנה דוגמה לקובץ JSONL. אפשר גם לציין מטא-נתונים בשדה structData.

{ "id": "d001", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/first_doc.html"}, "structData": {"property0": "value0", "property1": "value1", "property2": "value2"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"property0": "value0", "property1": "value3", "property2": "value4"} }

שלב 2: הגדרת מסננים

כדי להחיל ערכי סינון ישירות על חיפוש GKA, קוראים ל-API‏ SearchKnowledge. אפשר גם להוסיף שדה SearchConfig לבקשה, באופן הבא. בתיעוד של חיפוש מבוסס סוכנים מופיעות דוגמאות נוספות לביטויי סינון.

{
  "query": {
     "text": "test query"
  },
  "conversationProfile": "projects/PROJECT_ID/locations/LOCATION_ID/conversationProfiles/CONVERSATION_PROFILE_ID",
  "sessionId": "SESSION_ID",
  "conversation": "projects/PROJECT_ID/locations/LOCATION_ID/conversations/CONVERSATION_ID",
  "querySource": "AGENT_QUERY",
  "searchConfig": 
    "filterSpecs": [{
      "dataStores": ["projects/PROJECT_NUMBER/locations/LOCATION_ID/collections/default_collection/dataStores/DATASTORE_ID"],
      "filter": "property1 : ANY(\"value1\")" 
      }]
    }
  }
}

כדי להחיל ערכי מסננים על כל שאילתות החיפוש וההצעות של Knowledge בשיחה אחת, משתמשים ב-IngestContextReferences ומצרפים את מזהה השיחה לקריאה ל-SearchKnowledge.

מסנני מסמכים של PGKA

אפשר להחיל SearchConfig על קריאות ל-PGKA באמצעות IngestContextReferences API או הסימולטור במסוף Agent Assist.

API

שולחים קריאה ל-IngestContextReferences API כדי להחיל SearchConfig על קריאות ל-PGKA.

  1. קוראים לפונקציה CreateConversation > IngestContextReferences.
  2. ההגדרה חלה באופן אוטומטי על כל השאילתות הבאות של PGKA והצעות התשובות באותה שיחה.

בדוגמה הבאה מוצג אופן השימוש ב-API‏ IngestContextReferences.

{
  "conversation": "projects/PROJECT_ID/locations/global/conversations/CONVERSATION_ID",
  "contextReferences": {
   "gka_search_config": {
      "contextContents": [{
"content": "{ \"filterSpecs\": [{ \"dataStores\": [\"projects/PROJECT_NUMBER/locations/LOCATION_ID/collections/default_collection/dataStores/DATASTORE_ID\"], \"filter\": \"property1: ANY    (\\\"value1\\\")\" }] }",
        "contentFormat": "JSON"
      }],
      "updateMode": "OVERWRITE",
      "languageCode": "en-US"
    }
  }
}

המסוף

  1. עוברים אל מסוף Agent Assist, נכנסים לחשבון ובוחרים את הפרויקט.

    כניסה למסוף

  2. לוחצים על סימולטור ובוחרים את פרופיל השיחה.

  3. לוחצים על התחלה > הוספת הקשר.

  4. מזינים את המפתח, את התוכן ובוחרים באחד מהפורמטים הבאים.

    • טקסט פשוט
    • JSON
  5. לוחצים על Save.

זוהי דוגמה להקשר של הסימולטור.

  • מקרא: gka_search_config
  • פורמט: JSON
  • תוכן:
{ "filterSpecs": [{"dataStores" : ["projects/PROJECT_NUMBER/locations/LOCATION_ID/collections/default_collection/dataStores/DATASTORE_ID"], "filter" : "property1 : ANY(\"value1\")" }] }

מסנני בטיחות

תכונות גנרטיביות ב-Agent Assist כוללות מסנני בטיחות מובנים של אתיקה של בינה מלאכותית (RAI). המסננים האלה חיוניים למניעת יצירה של תוכן שעלול להיות מזיק או בלתי הולם. עם זאת, רמות הבטיחות שמוגדרות כברירת מחדל יכולות להיות מגבילות מדי לתעשיות מסוימות. לדוגמה, ספק שירותים רפואיים עשוי להצטרך להשיב על שאילתות לגיטימיות בנושאים רגישים שקשורים לבריאות, שאותם מסנני ברירת המחדל חוסמים. כדי להתאים את ההתנהגות של הגנרטור לצרכים העסקיים ולתרחישי השימוש שלכם, אתם יכולים להתאים אישית את הרגישות של מסנני הבטיחות לתכונה PGKA.

יסודות

יש שני רכיבים מרכזיים במסנני הבטיחות:

  • קטגוריית התוכן לסינון
  • רמת הרגישות של המסנן

קטגוריות של RAI

אפשר להגדיר רמת רגישות לקטגוריות התוכן הבאות:

  • תוכן מסוכן: תוכן שמתייחס לפגיעה עצמית או לכל דבר שהוא לא חוקי, בפיקוח או מסוכן.
  • תוכן מיני בוטה: תוכן מיני בוטה או תוכן שכולל חומרים פורנוגרפיים.
  • הטרדה: תוכן מעליב, מאיים או פוגעני.
  • דברי שטנה: תוכן שמקדם אלימות או מסית לשנאה נגד אנשים פרטיים או קבוצות על סמך מאפיינים מסוימים.

רמות רגישות

לכל קטגוריה של RAI, אפשר לבחור באחד מספי הרגישות הבאים:

  • BLOCK_MOST: חסימת מגוון רחב של תוכן שיכול להיות שייך לקטגוריה.
  • BLOCK_SOME: חסימת תוכן שמזוהה בבירור כתוכן ששייך לקטגוריה.
  • BLOCK_FEW: חסימה רק של המקרים החמורים ביותר של תוכן בקטגוריה.
  • BLOCK_NONE: משבית את כל המסננים לקטגוריה שצוינה.

הגדרות ברירת מחדל

אם לא מספקים הגדרה בהתאמה אישית לקטגוריה, Knowledge Assist הגנרטיבי הפרואקטיבי משתמש ברמות הרגישות הבאות שמוגדרות כברירת מחדל:

  • תוכן מסוכן: BLOCK_FEW
  • תוכן מיני בוטה: BLOCK_SOME
  • הטרדה: BLOCK_SOME
  • דברי שטנה: BLOCK_SOME

הגדרת מסנני בטיחות

הגדרת מסנני בטיחות בפרופיל השיחה. אתם יכולים לציין רמת רגישות לקטגוריה אחת או יותר של RAI על ידי הוספת אובייקט rai_settings להגדרת התכונה KNOWLEDGE_ASSIST. אפשר למצוא את הגדרות מסנן הבטיחות במערך feature_configs של תכונת ההצעות KNOWLEDGE_ASSIST.

{
  "name": "projects/PROJECT_ID/locations/LOCATION/conversationProfiles/PROFILE_ID",
  "human_agent_assistant_config": {
    "human_agent_suggestion_config": {
      "feature_configs": [
        {
          "suggestion_feature": {
            "type": "KNOWLEDGE_ASSIST"
          },
          "rai_settings": {
            "rai_category_configs": [
              {
                "category": "DANGEROUS_CONTENT",
                "sensitivity_level": "BLOCK_FEW"
              },
              {
                "category": "HARASSMENT",
                "sensitivity_level": "BLOCK_MOST"
              }
            ]
          }
        }
      ]
    }
  }
}

תצורות לדוגמה

בדוגמאות הבאות אפשר לראות איך מגבירים או מפחיתים את רמת הרגישות של קטגוריה מסוימת בהתאם לצורכי העסק.

דוגמה 1: מתן הרשאה לשאילתות רגישות בנושא בריאות

כספקי שירותים רפואיים, חשוב לכם לוודא ששאילתות בנושאים רגישים שקשורים לבריאות הנפש לא ייחסמו. כדי להפחית את רמת הרגישות של קטגוריית התוכן המסוכן, פועלים לפי השלבים הבאים.

"rai_settings": {
  "rai_category_configs": [
    {
      "category": "DANGEROUS_CONTENT",
      "sensitivity_level": "BLOCK_NONE"
    }
  ]
}

אם ההגדרה הזו מופעלת, סביר יותר שהתכונה 'עזרה יזומה באמצעות AI גנרטיבי' תעבד שאילתה כמו מהם סימני האזהרה של התאבדות? ותספק תשובה מועילה.

דוגמה 2: הגברת הקפדנות

אם אתם רוצים לנקוט משנה זהירות בנוגע להטרדה בעסק שלכם, אתם יכולים להגביר את הרגישות לקטגוריה הזו, ולהשאיר את שאר הקטגוריות ברמות ברירת המחדל שלהן, באופן הבא.

"rai_settings": {
  "rai_category_configs": [
    {
      "category": "HARASSMENT",
      "sensitivity_level": "BLOCK_MOST"
    }
  ]
}