Note: Vertex AI Search is being renamed to Agent Search. We are in the process of updating content to reflect the new branding.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

יצירת מאגר נתונים של חיפושים בתחום הבריאות

זהירות:

הגבלות בתחום הבריאות: כלקוחות, אסור לכם להשתמש בשירותי ה-AI הגנרטיבי למטרות קליניות (למען הבהרה, מחקר לא קליני, תזמון או משימות אדמיניסטרטיביות אחרות לא מוגבלים), כתחליף לייעוץ רפואי מקצועי או בכל אופן אחר שנמצא בפיקוח של רשות רגולטורית רלוונטית או שדורש אישור ממנה. כמו כן, אסור לכם לאפשר למשתמשי הקצה לעשות זאת. מידע נוסף זמין במאמר תנאים ספציפיים לשירות.
לשם הבהרה, בנוגע לשימוש בחיפוש מבוסס סוכנים כדי לאחזר ולסכם מידע רפואי קיים, ההגבלה על השימוש למטרות קליניות פירושה הגבלה על השימוש למטרות אבחון או טיפול ישירים ללא בדיקה על ידי איש מקצוע מורשה בהתאם לחוקים ולתקנות הרלוונטיים.
הפלט שנוצר לא תמיד אמין לחלוטין. בגלל האופי של מודלים גדולים של שפה (LLM) ו-AI גנרטיבי, יכול להיות שהפלט יכלול מידע שגוי או מוטה (למשל, סטריאוטיפים או תוכן פוגעני אחר), ולכן צריך לבדוק אותו. כל הסיכומים או התשובות הם טיוטות ולא סופיים.
השימוש המיועד במוצר הזה הוא לא לספק מידע שקשור למניעה, לאבחון או לטיפול במחלות. המוצר לא נועד לתת מענה לשאלות בנוגע להמלצות על אבחון או טיפול. השימוש המיועד במוצר הזה הוא לאחזר ולסכם מידע רפואי קיים שסופק על ידי משתמשים.
בגלל נתוני בדיקה מוגבלים, יכול להיות שהמוצר הזה לא מתאים לקבוצת הגיל 0-18 ולקבוצת הגיל 85 ומעלה. לכן, כשבודקים את הפלט שנוצר, הלקוחות צריכים להביא בחשבון את מידת הייצוג של אוכלוסיות משנה בנתוני המקור שלהם.

כדי לחפש נתונים קליניים בחיפוש באמצעות סוכן, אפשר לפעול לפי אחד מתהליכי העבודה הבאים:

ליצור מאגר נתונים של נתוני בריאות, לייבא נתוני FHIR R4 למאגר הנתונים, לקשר אותו לאפליקציה לחיפוש נתוני בריאות ולבצע שאילתה על הנתונים הקליניים.
ליצור אפליקציה לחיפוש נתונים בתחום הבריאות, ליצור מאגר נתונים בתחום הבריאות ולייבא נתוני FHIR R4 למאגר הנתונים במהלך תהליך יצירת האפליקציה, ולשאול שאילתות לגבי הנתונים הקליניים. מידע נוסף זמין במאמר יצירת אפליקציה לחיפוש מידע בתחום הבריאות.

בדף הזה נסביר על השיטה הראשונה.

מידע על תדירות ייבוא הנתונים

אפשר לייבא נתוני FHIR R4 למאגר נתונים בדרכים הבאות:

ייבוא באצווה: ייבוא חד-פעמי. הנתונים מיובאים למאגר נתונים בקבוצות. למידע נוסף על ייבוא מצטבר, אפשר לעיין במאמר בנושא רענון נתונים בתחום הבריאות.
ייבוא בסטרימינג: ייבוא נתונים בסטרימינג כמעט בזמן אמת. כל השינויים המצטברים במאגר FHIR של המקור מסונכרנים במאגר הנתונים של חיפוש מבוסס סוכנים. סטרימינג דורש מחבר נתונים, שהוא סוג של מאגר נתונים. כדי ליצור מחבר נתונים, צריך להגדיר אוסף. מחבר נתונים מכיל ישות, שהיא גם מופע של מאגר נתונים.

אפשר גם להשהות את הסטרימינג ולהמשיך אותו, ולבצע סנכרון ידני כשצריך. מידע נוסף זמין במאמר בנושא ניהול מאגר נתונים של חיפושים בתחום הבריאות.

קצב הזרמת הנתונים לפרויקט Google Cloud מסוים תלוי במכסות הבאות. אם תחרגו מהמכסה, יכול להיות שתיתקלו בעיכובים בהזרמת התוכן.
- מספר הכתיבות בסטרימינג של FHIR או BigQuery שממתינות בכל דקה. מידע נוסף זמין במאמר מכסות ומגבלות.
- מספר פעולות הקריאה של FHIR לדקה בכל אזור. מידע נוסף מופיע במאמר בנושא מכסות של Cloud Healthcare API FHIR.

אפשר לבחור את תדירות ייבוא הנתונים בזמן יצירת מאגר הנתונים, ואי אפשר לשנות את ההגדרה הזו בהמשך.

לפני שמתחילים

לפני שיוצרים את מאגר הנתונים של שירותי הבריאות ומייבאים אליו נתונים, חשוב להבין את הנקודות הבאות:

הקשר בין אפליקציות למאגרי נתונים לחיפוש בתחום הבריאות. מידע נוסף מופיע במאמר בנושא אפליקציות ומאגרי נתונים.
הכנת נתוני FHIR להטמעה.
התכונה Agent Search for healthcare מספקת שירותי חיפוש רק באזור הגיאוגרפי המורכב מאזורים רבים בארה"ב (us). לכן, אפליקציית החיפוש ומאגרי הנתונים שלכם בתחום הבריאות צריכים להיות ממוקמים באזור הגיאוגרפי המורכב מאזורים רבים us.
אם אתם מייבאים נתונים בתחום הבריאות ממאגר FHIR של Cloud Healthcare API בפרויקט אחד Google Cloud למאגר נתונים של חיפוש מבוסס סוכנים בפרויקט אחר Google Cloud ואתם משתמשים ב-VPC Service Controls, שני הפרויקטים צריכים להיות באותו גבולות גזרה.

יצירת מאגר נתונים וייבוא הנתונים

אתם יכולים ליצור מאגר נתונים ולייבא את נתוני FHIR R4 באמצעותGoogle Cloud המסוף או ה-API, באחת מהדרכים הבאות:

אתם יכולים ליצור מאגר נתונים סטטי באמצעות ייבוא אצווה חד-פעמי. מידע נוסף זמין במאמר בנושא יצירה של מאגר נתונים סטטי וביצוע ייבוא חד-פעמי של נתונים.
אתם יכולים ליצור מאגר נתונים של סטרימינג עם שינויים ממאגר ה-FHIR של Cloud Healthcare API שמוזרמים באופן רציף למאגר הנתונים של חיפוש מבוסס סוכנים. מידע נוסף זמין במאמר בנושא יצירה של מאגר נתונים בסטרימינג והגדרת ייבוא בסטרימינג.

ההרשאות שנדרשות למשימה הזו

מקצים את התפקידים הבאים ב-Identity and Access Management (IAM) לחשבון השירות service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com בפרויקט שמכיל את מאגר הנתונים של חיפוש מבוסס סוכנים:

מטרה	תפקידים
כדי לבצע ייבוא חד-פעמי של נתוני FHIR מחנויות FHIR ב-Cloud Healthcare API.	BigQuery Job User (`roles/bigquery.jobUser`) עריכה של נתוני BigQuery‏ (`roles/bigquery.dataEditor`) אדמין של חנות FHIR בתחום הבריאות (`roles/healthcare.fhirStoreAdmin`)
כדי לבצע ייבוא בהזרמה של נתוני FHIR מחנויות FHIR ב-Cloud Healthcare API באותו Google Cloud פרויקט.	BigQuery Job User (`roles/bigquery.jobUser`) עריכה של נתוני BigQuery‏ (`roles/bigquery.dataEditor`) אדמין של חנות FHIR בתחום הבריאות (`roles/healthcare.fhirStoreAdmin`) קריאת משאב FHIR בתחום הבריאות (`roles/healthcare.fhirResourceReader`)
כדי לבצע ייבוא של נתוני FHIR ממאגרי FHIR ב-Cloud Healthcare API בפרויקט Google Cloud אחר.	BigQuery Job User (`roles/bigquery.jobUser`) עריכה של נתוני BigQuery‏ (`roles/bigquery.dataEditor`) אדמין של חנות FHIR בתחום הבריאות (`roles/healthcare.fhirStoreAdmin`) קריאת משאב FHIR בתחום הבריאות (`roles/healthcare.fhirResourceReader`)
כדי לייבא נתוני FHIR שמפנים לקבצים ב-Cloud Storage. ההרשאות האלה מוענקות כברירת מחדל אם הקבצים שאליהם יש הפניה נמצאים באותו פרויקט של אפליקציית Agent Search. Google Cloud	אדמין של אובייקטים באחסון (`roles/storage.objectAdmin`)
כדי להתאים אישית את הסכימה כשיוצרים מאגר נתונים כדי להגדיר את האפשרות לאינדוקס, לאחזור ולחיפוש של משאבי FHIR ורכיבים.	אדמין של אובייקטים באחסון (`roles/storage.objectAdmin`)

צריך להקצות את התפקידים הבאים של ניהול זהויות והרשאות גישה (IAM) לservice-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.comחשבון השירות בפרויקט שמכיל את מאגר הנתונים של Cloud Healthcare API FHIR R4:

מטרה	תפקידים
כדי לבצע ייבוא של נתוני FHIR ממאגרי FHIR ב-Cloud Healthcare API בפרויקט Google Cloud אחר.	אדמין של חנות FHIR בתחום הבריאות (`roles/healthcare.fhirStoreAdmin`) קריאת משאב FHIR בתחום הבריאות (`roles/healthcare.fhirResourceReader`)

צריך להקצות את התפקידים הבאים של ניהול זהויות והרשאות גישה (IAM) לservice-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.comחשבון השירות בפרויקט שמכיל את מאגר הנתונים של Cloud Healthcare API FHIR R4:

מטרה	תפקידים
כדי לבצע ייבוא בהזרמה של נתוני FHIR מחנויות FHIR ב-Cloud Healthcare API באותו Google Cloud פרויקט.	BigQuery Job User (`roles/bigquery.jobUser`) עריכה של נתוני BigQuery‏ (`roles/bigquery.dataEditor`)
כדי להתאים אישית את הסכימה כשיוצרים מאגר נתונים כדי להגדיר את האפשרות לאינדוקס, לאחזור ולחיפוש של משאבי FHIR ורכיבים.	אדמין של אובייקטים באחסון (`roles/storage.objectAdmin`)

יצירת מאגר נתונים סטטי וביצוע ייבוא חד-פעמי של אצווה

בקטע הזה מוסבר איך ליצור מאגר נתונים של חיפוש מבוסס סוכנים שבו אפשר לבצע רק ייבוא באצ'ים. אתם יכולים לייבא נתונים בכמויות גדולות כשאתם יוצרים את מאגר הנתונים בפעם הראשונה, ולבצע ייבוא מצטבר של נתונים בכמויות גדולות כשצריך.

המסוף

נכנסים לדף AI Applications במסוף Google Cloud .

אפליקציות AI
בתפריט הניווט, לוחצים על מאגרי נתונים.
לוחצים על יצירת מאגר נתונים.
בחלונית בחירת מקור נתונים, בוחרים באפשרות Healthcare API (FHIR) כמקור הנתונים.
כדי לייבא נתונים ממאגר FHIR, מבצעים אחת מהפעולות הבאות:
- בוחרים את מאגר ה-FHIR מתוך רשימת מאגרי ה-FHIR הזמינים:
  1. מרחיבים את השדה FHIR store.
  2. ברשימה הזו, בוחרים מערך נתונים שנמצא במיקום מותר, ואז בוחרים מאגר FHIR שמשתמש ב-FHIR בגרסה R4.
- מזינים את מאגר ה-FHIR באופן ידני:
  1. מרחיבים את השדה FHIR store.
  2. לוחצים על הזנת מאגר FHIR באופן ידני.
  3. בתיבת הדו-שיח FHIR store name (שם מאגר FHIR), מזינים את השם המלא של מאגר FHIR בפורמט הבא:
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. לוחצים על Save.
בקטע סנכרון, בוחרים באחת מהאפשרויות הבאות. אי אפשר לשנות את הבחירה הזו אחרי שיוצרים את מאגר הנתונים.
- חד-פעמי: כדי לבצע ייבוא חד-פעמי של נתונים באצווה. למידע נוסף על ייבוא מצטבר, אפשר לעיין במאמר בנושא רענון נתונים בתחום הבריאות.
- סטרימינג: כדי לבצע ייבוא של נתונים בסטרימינג כמעט בזמן אמת. כדי להזרים נתונים, צריך ליצור מחבר נתונים, שהוא סוג של מאגר נתונים. כדי להגדיר מאגר נתונים של סטרימינג באמצעות API בארכיטקטורת REST, צריך לפנות ל-Customer Engineer.
בקטע מה הסכימה של הנתונים האלה?, בוחרים באחת מהאפשרויות הבאות:
- סכימה מוגדרת מראש של Google: כדי לשמור את הגדרות הסכימה שהוגדרו על ידי Google, כמו זמינות להוספה לאינדקס, קלות החיפוש ואפשרות אחזור, עבור רכיבי FHIR ומשאבים נתמכים. אחרי שבוחרים באפשרות הזו, אי אפשר לעדכן את הסכימה אחרי שיוצרים את מאגר הנתונים. אם רוצים לשנות את הסכימה אחרי יצירת מאגר הנתונים, בוחרים באפשרות סכימה בהתאמה אישית.
  1. לוחצים על Continue.
  2. בשדה Your data store name, מזינים שם למאגר הנתונים.
  3. לוחצים על יצירה.
- סכימה מותאמת אישית: כדי להגדיר את תצורות הסכימה שלכם, כמו זמינות להוספה לאינדקס, קלות החיפוש ואפשרות לאחזור, עבור משאבי FHIR ורכיבים נתמכים. כדי להגדיר סכימה שאפשר להגדיר, צריך לפנות למהנדס הלקוחות.
  1. לוחצים על Continue.
  2. בודקים את הסכימה, מרחיבים כל שדה ועורכים את הגדרות השדה.
  3. לוחצים על הוספת שדות חדשים כדי להוסיף שדות חדשים במשאבי FHIR הנתמכים. אי אפשר להסיר את השדות שמופיעים בסכימה שהוגדרה על ידי Google.
  4. לוחצים על Continue.
  5. בשדה Your data connector name (השם של מחבר הנתונים), מזינים שם למחבר הנתונים.
  6. לוחצים על יצירה.
לוחצים על Continue.

REST

יוצרים מאגר נתונים.
```
curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- ‫DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים שרוצים ליצור. המזהה יכול להכיל רק אותיות קטנות, ספרות, קווים תחתונים ומקפים.
- ‫DATA_STORE_DISPLAY_NAME: השם המוצג של מאגר הנתונים של חיפוש מבוסס סוכנים שרוצים ליצור.
- ‫CONFIGURABLE_SCHEMA_TRUE|FALSE: ערך בוליאני. אם הערך מוגדר כ-true, אפשר להגדיר את סכימת מאגר הנתונים באמצעות ה-method schema.update.
תשובה

אתם אמורים לקבל תגובת JSON שדומה לזו: אם הערך של המפתח done הוא true, המשמעות היא שהפעולה ליצירת מאגר הנתונים הושלמה. אחרת, הפעולה של יצירת מאגר הנתונים נכשלה.
```
{
  "name": "OPERATION_ID",
  "done": true
}
```
אם מאגר ה-FHIR של המקור ומאגר הנתונים של חיפוש מבוסס סוכנים של היעד נמצאים באותו פרויקט Google Cloud , צריך לקרוא לשיטה הבאה כדי לבצע ייבוא חד-פעמי של קבוצת נתונים. אם הם לא באותו פרויקט, עוברים לשלב הבא.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- ‫DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים.
- ‫CLOUD_HEALTHCARE_DATASET_ID: המזהה של מערך הנתונים ב-Cloud Healthcare API שמכיל את מאגר ה-FHIR של המקור.
- ‫CLOUD_HEALTHCARE_DATASET_LOCATION: המיקום של מערך הנתונים של Cloud Healthcare API שמכיל את מאגר ה-FHIR של המקור.
- ‫FHIR_STORE_ID: המזהה של מאגר FHIR R4 ב-Cloud Healthcare API.
תשובה

אתם אמורים לקבל תגובת JSON שדומה לזו: התשובה מכילה מזהה של פעולה ממושכת. פעולות ממושכות מוחזרות כשקריאות לשיטות עשויות להימשך זמן רב. שימו לב לערך של IMPORT_OPERATION_ID. תצטרכו את הערך הזה כדי לאמת את סטטוס הייבוא או כדי לבטל ייבוא של קבוצת קבצים שנמצא בעיצומו.
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
אם מאגר ה-FHIR של המקור ומאגר הנתונים של חיפוש מבוסס סוכנים של היעד נמצאים בפרויקטים שונים Google Cloud , צריך להפעיל את השיטה הבאה כדי לבצע ייבוא חד-פעמי של נתונים. אם הם באותו פרויקט, חוזרים לשלב הקודם.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
מחליפים את מה שכתוב בשדות הבאים:
- PROJECT_ID: המזהה של Google Cloudהפרויקט שמכיל את מאגר הנתונים של חיפוש מבוסס סוכנים.
- ‫DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים.
- ‫SOURCE_PROJECT_ID: המזהה של Google Cloudהפרויקט שמכיל את מערך הנתונים של Cloud Healthcare API ואת מאגר FHIR.
- ‫CLOUD_HEALTHCARE_DATASET_ID: המזהה של מערך הנתונים ב-Cloud Healthcare API שמכיל את מאגר ה-FHIR של המקור.
- ‫CLOUD_HEALTHCARE_DATASET_LOCATION: המיקום של מערך הנתונים של Cloud Healthcare API שמכיל את מאגר ה-FHIR של המקור.
- ‫FHIR_STORE_ID: המזהה של מאגר FHIR R4 ב-Cloud Healthcare API.
תשובה

אתם אמורים לקבל תגובת JSON שדומה לזו: התשובה מכילה מזהה של פעולה ממושכת. פעולות ממושכות מוחזרות כשקריאות לשיטות עשויות להימשך זמן רב. שימו לב לערך של IMPORT_OPERATION_ID. תצטרכו את הערך הזה כדי לאמת את סטטוס הייבוא.
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Python.

כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.