医療検索データストアを作成する

注意:

ヘルスケアに関する制限: お客様は、生成 AI サービスを臨床目的（明確にするために記すと、非臨床研究、スケジュール設定、またはその他の管理業務は制限されません）、専門的な医療アドバイスの代用として、または該当する規制機関の監督下にある、もしくは該当する規制機関の許可もしくは承認を必要とする方法で使用してはならず、エンドユーザーにも使用させてはなりません。詳しくは、サービス固有の規約をご覧ください。
明確にするために記すと、Vertex AI Search を使用して既存の医療情報を取得して要約する場合、臨床目的での使用の制限とは、適用される法律および規制に準拠して、ライセンス取得済みの専門家による審査なしで直接診断または治療の目的で使用することを制限することを意味します。
生成された出力は、必ずしも完全に信頼できるとは限りません。LLM と生成 AI の性質上、出力には誤った情報や偏った情報（ステレオタイプや他の有害なコンテンツなど）が含まれている可能性があるため、確認する必要があります。すべての要約や回答は、最終版ではなく草稿とお考えください。
このプロダクトが意図する使用は、病気や疾患の予防、診断、治療に関する情報を提供することではありません。診断や治療の推奨に関する質問は、このプロダクトでの対応を意図していません。このプロダクトが意図する使用は、ユーザーから提供された既存の医療情報を取得して要約することです。
テストデータが限られているため、このプロダクトは 0 から 18 歳の年齢層と 85 歳以上の年齢層に適している場合とそうでない場合があります。したがって、生成された出力を確認する際は、ソースデータ内のサブポピュレーションの代表性を考慮する必要があります。

Vertex AI Search で臨床データを検索するには、次のいずれかのワークフローを使用します。

医療データストアを作成し、FHIR R4 データをデータストアにインポートして医療検索アプリに接続し、臨床データをクエリします。
医療検索アプリを作成し、医療データストアを作成して、アプリの作成プロセス中に FHIR R4 データをデータストアにインポートし、臨床データをクエリします。詳細については、医療検索アプリを作成するをご覧ください。

このページでは、最初の方法について説明します。

データインポートの頻度について

FHIR R4 データをデータストアにインポートするには、次の方法があります。

一括インポート: 1 回限りのインポート。データはバッチでデータストアにインポートされます。その他の増分インポートについては、医療データを更新するをご覧ください。
ストリーミングインポート: ニアリアルタイムのストリーミングデータのインポート。ソース FHIR ストアの増分変更は、Vertex AI Search データストアで同期されます。ストリーミングには、データストアの一種であるデータコネクタが必要です。データコネクタを作成するには、コレクションを設定する必要があります。データコネクタには、データストアインスタンスでもあるエンティティが含まれています。

また、必要に応じてストリーミングを一時停止して再開したり、手動で同期したりすることもできます。詳細については、医療検索データストアを管理するをご覧ください。

特定の Google Cloud プロジェクトのデータストリーミングレートは、次の割り当てによって異なります。割り当てを超えると、ストリーミングが遅延する可能性があります。
- 1 分あたりの保留中の FHIR または BigQuery ストリーミング書き込みの数。詳細については、割り当てと上限をご覧ください。
- 1 分間、1 リージョンあたりの FHIR 読み取りオペレーション数。詳細については、Cloud Healthcare API FHIR の割り当てをご覧ください。

データインポートの頻度は、データストアの作成時に選択できます。この構成は後で変更できません。

始める前に

医療データストアを作成してデータをインポートする前に、次のことを理解しておいてください。

医療検索のアプリとデータストアの関係。詳細については、アプリとデータストアについてをご覧ください。
取り込む FHIR データの準備。
Vertex AI Search for Healthcare は、米国のマルチリージョン（us）でのみ検索サービスを提供します。したがって、医療検索アプリとデータストアは us マルチリージョンに配置する必要があります。
1 つの Google Cloud プロジェクトの Cloud Healthcare API FHIR ストアから別の Google Cloud プロジェクトの Vertex AI Search データストアに医療データをインポートし、VPC Service Controls を使用している場合、2 つのプロジェクトは同じ境界内に存在する必要があります。

データストアを作成してデータをインポートする

Google Cloud コンソールまたは API を使用して、次の方法でデータストアを作成し、FHIR R4 データをインポートできます。

1 回限りのバッチインポートで静的データストアを作成できます。詳細については、静的データストアを作成して 1 回限りのバッチインポートを実行するをご覧ください。
Cloud Healthcare API FHIR ストアの変更が Vertex AI Search データストアに継続的にストリーミングされるストリーミングデータストアを作成できます。詳細については、ストリーミングデータストアを作成してストリーミングインポートを設定するをご覧ください。

このタスクに必要な権限

Vertex AI Search データストアを含むプロジェクトの service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com サービスアカウントに、次の Identity and Access Management（IAM）ロールを付与します。

目的	ロール
Cloud Healthcare API の FHIR ストアから FHIR データを 1 回だけバッチインポートする場合。	BigQuery ジョブユーザー（`roles/bigquery.jobUser`） BigQuery データ編集者（`roles/bigquery.dataEditor`） Healthcare FHIR ストア管理者（`roles/healthcare.fhirStoreAdmin`）
同じ Google Cloud プロジェクト内の Cloud Healthcare API の FHIR ストアから FHIR データをストリーミングインポートする。	BigQuery ジョブユーザー（`roles/bigquery.jobUser`） BigQuery データ編集者（`roles/bigquery.dataEditor`） Healthcare FHIR ストア管理者（`roles/healthcare.fhirStoreAdmin`） Healthcare FHIR リソース読み取り（`roles/healthcare.fhirResourceReader`）
別の Google Cloud プロジェクトの Cloud Healthcare API の FHIR ストアから FHIR データをストリーミングインポートする。	BigQuery ジョブユーザー（`roles/bigquery.jobUser`） BigQuery データ編集者（`roles/bigquery.dataEditor`） Healthcare FHIR ストア管理者（`roles/healthcare.fhirStoreAdmin`） Healthcare FHIR リソース読み取り（`roles/healthcare.fhirResourceReader`）
Cloud Storage 内のファイルを参照する FHIR データをインポートするには。参照されるファイルが Vertex AI Search アプリと同じ Google Cloud プロジェクトにある場合、これらの権限はデフォルトで付与されます。	ストレージオブジェクト管理者（`roles/storage.objectAdmin`）
データストアの作成時にスキーマをカスタマイズして、FHIR リソースと要素のインデックス登録可能性、検索可能性、取得可能性を構成するには。	ストレージオブジェクト管理者（`roles/storage.objectAdmin`）

Cloud Healthcare API FHIR R4 データストアを含むプロジェクトの service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com サービスアカウントに、次の Identity and Access Management ロールを付与します。

目的	ロール
別の Google Cloud プロジェクトの Cloud Healthcare API の FHIR ストアから FHIR データをストリーミングインポートする。	Healthcare FHIR ストア管理者（`roles/healthcare.fhirStoreAdmin`） Healthcare FHIR リソース読み取り（`roles/healthcare.fhirResourceReader`）

Cloud Healthcare API FHIR R4 データストアを含むプロジェクトの service-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.com サービスアカウントに、次の Identity and Access Management ロールを付与します。

目的	ロール
同じ Google Cloud プロジェクト内の Cloud Healthcare API の FHIR ストアから FHIR データをストリーミングインポートする。	BigQuery ジョブユーザー（`roles/bigquery.jobUser`） BigQuery データ編集者（`roles/bigquery.dataEditor`）
データストアの作成時にスキーマをカスタマイズして、FHIR リソースと要素のインデックス登録可能性、検索可能性、取得可能性を構成するには。	ストレージオブジェクト管理者（`roles/storage.objectAdmin`）

静的データストアを作成して 1 回限りの一括インポートを実行する

このセクションでは、バッチインポートのみを実行できる Vertex AI Search データストアを作成する方法について説明します。バッチデータは、データストアを最初に作成するときにインポートできます。また、必要に応じて増分バッチインポートを実行することもできます。

コンソール

Google Cloud コンソールで、[AI Applications] ページに移動します。

AI Applications
ナビゲーションメニューで [データストア] をクリックします。
データストアを作成 をクリックします。
[データソースを選択] ペインで、データソースとして [Healthcare API（FHIR）] を選択します。
FHIR ストアからデータをインポートするには、次のいずれかを行います。
- 使用可能な FHIR ストアのリストから FHIR ストアを選択します。
  1. [FHIR ストア] フィールドを開きます。
  2. このリストで、許可されたロケーションにあるデータセットを選択し、FHIR バージョン R4 を使用する FHIR ストアを選択します。
- FHIR ストアを手動で入力します。
  1. [FHIR ストア] フィールドを開きます。
  2. [FHIR ストアを手動で入力] をクリックします。
  3. [FHIR ストア名] ダイアログで、FHIR ストアの完全な名前を次の形式で入力します。
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. [保存] をクリックします。
[ロケーション] セクションで、次のいずれかのオプションを選択します。この選択は、データストアの作成後に変更することはできません
- 1 回限り: 1 回限りの一括データインポートを実行します。その他の増分インポートについては、医療データを更新するをご覧ください。
- ストリーミング: ニアリアルタイムのストリーミングデータのインポートを実行します。データをストリーミングするには、データストアの一種であるデータコネクタを作成する必要があります。REST API を使用してストリーミングデータストアを設定するには、カスタマーエンジニアにお問い合わせください。
[このデータのスキーマ] セクションで、次のいずれかのオプションを選択します。
- Google の事前定義スキーマ: サポートされている FHIR リソースと要素に対して、Google が定義したスキーマ構成（インデックス登録可能性、検索可能性、取得可能性など）を保持します。このオプションを選択すると、データストアの作成後にスキーマを更新することはできません。データストアの作成後にスキーマを変更できるようにするには、[カスタムスキーマ] オプションを選択します。
  1. [続行] をクリックします。
  2. [データストア名] フィールドに、データストアの名前を入力します。
  3. [作成] をクリックします。
- カスタムスキーマ: サポートされている FHIR リソースと要素に独自のスキーマ構成（インデックス登録可能性、検索可能性、取得可能性など）を定義します。構成可能なスキーマを設定するには、カスタマーエンジニアにお問い合わせください。
  1. [続行] をクリックします。
  2. スキーマを確認し、各フィールドを開いて、フィールド設定を編集します。
  3. [新しいフィールドを追加する] をクリックして、サポートされている FHIR リソースに新しいフィールドを追加します。Google 定義のスキーマで提供されているフィールドは削除できません。
  4. [続行] をクリックします。
  5. [データコネクタ名] フィールドに、データコネクタの名前を入力します。
  6. [作成] をクリックします。
[続行] をクリックします。

REST

データストアを作成します。
```
curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'
```
次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- DATA_STORE_ID: 作成する Vertex AI Search データストアの ID。この ID に使用できるのは、小文字、数字、アンダースコア、ハイフンのみです。
- DATA_STORE_DISPLAY_NAME: 作成する Vertex AI Search データストアの表示名。
- CONFIGURABLE_SCHEMA_TRUE|FALSE: true に設定すると、schema.update メソッドを使用してデータストアスキーマを構成できるブール値。
レスポンス

次のような JSON レスポンスが返されます。done キーの値が true の場合、データストアを作成するオペレーションが完了したことを示します。それ以外の場合、データストアの作成オペレーションは失敗しました。
```
{
  "name": "OPERATION_ID",
  "done": true
}
```
ソース FHIR ストアとターゲット Vertex AI Search データストアが同じ Google Cloud プロジェクトにある場合は、次のメソッドを呼び出して 1 回限りの一括インポートを実行します。同じプロジェクトにない場合は、次のステップに進みます。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- DATA_STORE_ID: Vertex AI Search データストアの ID。
- CLOUD_HEALTHCARE_DATASET_ID: ソース FHIR ストアを含む Cloud Healthcare API データセットの ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION: ソース FHIR ストアを含む Cloud Healthcare API データセットのロケーション。
- FHIR_STORE_ID: Cloud Healthcare API FHIR R4 ストアの ID。
レスポンス

次のような JSON レスポンスが返されます。レスポンスには、長時間実行オペレーションの ID が含まれます。長時間実行オペレーションは、メソッドの呼び出しが完了するまでにかなりの時間がかかる場合に返されます。IMPORT_OPERATION_ID の値をメモします。この値は、インポートのステータスを確認したり、進行中のバッチインポートをキャンセルしたりするために必要です。
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
ソース FHIR ストアとターゲット Vertex AI Search データストアが異なる Google Cloud プロジェクトにある場合は、次のメソッドを呼び出して 1 回限りの一括インポートを実行します。同じプロジェクトに属している場合は、前の手順に戻ります。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
次のように置き換えます。
- PROJECT_ID: Vertex AI Search データストアを含む Google Cloudプロジェクトの ID。
- DATA_STORE_ID: Vertex AI Search データストアの ID。
- SOURCE_PROJECT_ID: Cloud Healthcare API データセットと FHIR ストアを含む Google Cloudプロジェクトの ID。
- CLOUD_HEALTHCARE_DATASET_ID: ソース FHIR ストアを含む Cloud Healthcare API データセットの ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION: ソース FHIR ストアを含む Cloud Healthcare API データセットのロケーション。
- FHIR_STORE_ID: Cloud Healthcare API FHIR R4 ストアの ID。
レスポンス

次のような JSON レスポンスが返されます。レスポンスには、長時間実行オペレーションの ID が含まれます。長時間実行オペレーションは、メソッドの呼び出しが完了するまでにかなりの時間がかかる場合に返されます。IMPORT_OPERATION_ID の値をメモします。この値は、インポートのステータスを確認するために必要です。
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

詳細については、Vertex AI Search Python API のリファレンスドキュメントをご覧ください。

Vertex AI Search に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。

データストアを作成する


from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "global"
# data_store_id = "YOUR_DATA_STORE_ID"


def create_data_store_sample(
    project_id: str,
    location: str,
    data_store_id: str,
) -> str:
    #  For more information, refer to:
    # https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
    client_options = (
        ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
        if location != "global"
        else None
    )

    # Create a client
    client = discoveryengine.DataStoreServiceClient(client_options=client_options)

    # The full resource name of the collection
    # e.g. projects/{project}/locations/{location}/collections/default_collection
    parent = client.collection_path(
        project=project_id,
        location=location,
        collection="default_collection",
    )

    data_store = discoveryengine.DataStore(
        display_name="My Data Store",
        # Options: GENERIC, MEDIA, HEALTHCARE_FHIR
        industry_vertical=discoveryengine.IndustryVertical.GENERIC,
        # Options: SOLUTION_TYPE_RECOMMENDATION, SOLUTION_TYPE_SEARCH, SOLUTION_TYPE_CHAT, SOLUTION_TYPE_GENERATIVE_CHAT
        solution_types=[discoveryengine.SolutionType.SOLUTION_TYPE_SEARCH],
        # TODO(developer): Update content_config based on data store type.
        # Options: NO_CONTENT, CONTENT_REQUIRED, PUBLIC_WEBSITE
        content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
    )

    request = discoveryengine.CreateDataStoreRequest(
        parent=parent,
        data_store_id=data_store_id,
        data_store=data_store,
        # Optional: For Advanced Site Search Only
        # create_advanced_site_search=True,
    )

    # Make the request
    operation = client.create_data_store(request=request)

    print(f"Waiting for operation to complete: {operation.operation.name}")
    response = operation.result()

    # After the operation is complete,
    # get information from operation metadata
    metadata = discoveryengine.CreateDataStoreMetadata(operation.metadata)

    # Handle the response
    print(response)
    print(metadata)

    return operation.operation.name

ドキュメントのインポート

from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "us"
# data_store_id = "YOUR_DATA_STORE_ID"
# healthcare_project_id = "YOUR_HEALTHCARE_PROJECT_ID"
# healthcare_location = "YOUR_HEALTHCARE_LOCATION"
# healthcare_dataset_id = "YOUR_HEALTHCARE_DATASET_ID"
# healthcare_fihr_store_id = "YOUR_HEALTHCARE_FHIR_STORE_ID"

#  For more information, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
client_options = (
    ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
    if location != "global"
    else None
)

# Create a client
client = discoveryengine.DocumentServiceClient(client_options=client_options)

# The full resource name of the search engine branch.
# e.g. projects/{project}/locations/{location}/dataStores/{data_store_id}/branches/{branch}
parent = client.branch_path(
    project=project_id,
    location=location,
    data_store=data_store_id,
    branch="default_branch",
)

request = discoveryengine.ImportDocumentsRequest(
    parent=parent,
    fhir_store_source=discoveryengine.FhirStoreSource(
        fhir_store=client.fhir_store_path(
            healthcare_project_id,
            healthcare_location,
            healthcare_dataset_id,
            healthcare_fihr_store_id,
        ),
    ),
    # Options: `FULL`, `INCREMENTAL`
    reconciliation_mode=discoveryengine.ImportDocumentsRequest.ReconciliationMode.INCREMENTAL,
)

# Make the request
operation = client.import_documents(request=request)

print(f"Waiting for operation to complete: {operation.operation.name}")
response = operation.result()

# After the operation is complete,
# get information from operation metadata
metadata = discoveryengine.ImportDocumentsMetadata(operation.metadata)

# Handle the response
print(response)
print(metadata)

次のステップ

ストリーミングデータストアを作成してストリーミングインポートを設定する

このセクションでは、Cloud Healthcare API FHIR ストアから変更を継続的にストリーミングするストリーミング Vertex AI Search データストアを作成する方法について説明します。

コンソール

Google Cloud コンソールで、[AI Applications] ページに移動します。

AI Applications
ナビゲーションメニューで [データストア] をクリックします。
データストアを作成 をクリックします。
[データソースを選択] ペインで、データソースとして [Healthcare API（FHIR）] を選択します。
FHIR ストアからデータをインポートするには、次のいずれかを行います。
- 使用可能な FHIR ストアのリストから FHIR ストアを選択します。
  1. [FHIR ストア] フィールドを開きます。
  2. このリストで、許可されたロケーションにあるデータセットを選択し、FHIR バージョン R4 を使用する FHIR ストアを選択します。
- FHIR ストアを手動で入力します。
  1. [FHIR ストア] フィールドを開きます。
  2. [FHIR ストアを手動で入力] をクリックします。
  3. [FHIR ストア名] ダイアログで、FHIR ストアの完全な名前を次の形式で入力します。
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. [保存] をクリックします。
[ロケーション] セクションで、次のいずれかのオプションを選択します。この選択は、データストアの作成後に変更することはできません
- 1 回限り: 1 回限りの一括データインポートを実行します。その他の増分インポートについては、医療データを更新するをご覧ください。
- ストリーミング: ニアリアルタイムのストリーミングデータのインポートを実行します。データをストリーミングするには、データストアの一種であるデータコネクタを作成する必要があります。REST API を使用してストリーミングデータストアを設定するには、カスタマーエンジニアにお問い合わせください。
[このデータのスキーマ] セクションで、次のいずれかのオプションを選択します。
- Google の事前定義スキーマ: サポートされている FHIR リソースと要素に対して、Google が定義したスキーマ構成（インデックス登録可能性、検索可能性、取得可能性など）を保持します。このオプションを選択すると、データストアの作成後にスキーマを更新することはできません。データストアの作成後にスキーマを変更できるようにするには、[カスタムスキーマ] オプションを選択します。
  1. [続行] をクリックします。
  2. [データストア名] フィールドに、データストアの名前を入力します。
  3. [作成] をクリックします。
- カスタムスキーマ: サポートされている FHIR リソースと要素に独自のスキーマ構成（インデックス登録可能性、検索可能性、取得可能性など）を定義します。構成可能なスキーマを設定するには、カスタマーエンジニアにお問い合わせください。
  1. [続行] をクリックします。
  2. スキーマを確認し、各フィールドを開いて、フィールド設定を編集します。
  3. [新しいフィールドを追加する] をクリックして、サポートされている FHIR リソースに新しいフィールドを追加します。Google 定義のスキーマで提供されているフィールドは削除できません。
  4. [続行] をクリックします。
  5. [データコネクタ名] フィールドに、データコネクタの名前を入力します。
  6. [作成] をクリックします。
[続行] をクリックします。

REST

データコネクタを作成してストリーミングを設定します。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \
-d ' {
  "collectionId": "COLLECTION_ID",
  "collectionDisplayName": "COLLECTION_NAME",
  "dataConnector": {
  "dataSource": "gcp_fhir",
  "params": {
      "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID"
    },
    "entities": [
      {
        "entityName": "FHIR_STORE_NAME"
        "healthcareFhirConfig": {
          "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE,
          "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE
        }
      }
    ],
    "syncMode": "STREAMING"
  }
}'
```
次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- COLLECTION_ID: FHIR R4 データをストリーミングするコレクションの ID。
- COLLECTION_NAME: FHIR R4 データをストリーミングするコレクションの名前。
- SOURCE_PROJECT_ID: Cloud Healthcare API データセットと FHIR ストアを含む Google Cloudプロジェクトの ID。
- CLOUD_HEALTHCARE_DATASET_ID: ソース FHIR ストアを含む Cloud Healthcare API データセットの ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION: ソース FHIR ストアを含む Cloud Healthcare API データセットのロケーション。
- FHIR_STORE_ID: Cloud Healthcare API FHIR R4 ストアの ID。
- CONFIGURABLE_SCHEMA_TRUE|FALSE: true に設定すると、schema.update メソッドを使用してデータストアスキーマを構成できるブール値。
- STATIC_INDEXING_TRUE|FALSE: true に設定すると、インデックス作成割り当て量が多い過去のデータをインポートできます。これは、検索アプリでデータ量が増加することが予想される場合に便利です。ただし、個々のレコードのインデックス作成には時間がかかります。このフィールドは true に設定することを強くおすすめします。
レスポンス

次のような JSON レスポンスが返されます。done キーの値が true の場合、データストアを作成するオペレーションが完了したことを示します。それ以外の場合、データストアの作成オペレーションは失敗しました。
```
{
  "name": "OPERATION_ID",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1main.DataConnector"
  }
}
```
- コレクションが正常に作成されると、 Google Cloud コンソールの [データストア] ページのデータストアのリストにデータコネクタが追加されます。
- 作成されたデータコネクタには、データのストリーミング元である FHIR R4 ストアと同じ名前のエンティティが含まれています。

次のステップ

データストアの作成と FHIR データのインポートを確認する

このタスクでは、データストアが正常に作成されたかどうか、FHIR データがデータストアに正常にインポートされたかどうかを確認する方法について説明します。

Google Cloud コンソールで、データストアを選択して詳細を確認します。
REST API を使用する:
1. dataStores.get メソッドを使用して、医療データストアの詳細を取得します。
2. インポートオペレーションの詳細を取得するには、operations.get メソッドを使用します。

データストアの作成とデータインポートを確認する手順は次のとおりです。

コンソール

Google Cloud コンソールで、[AI Applications] ページに移動します。

AI Applications
ナビゲーションメニューで [データストア] をクリックします。

[データストア] ページに、 Google Cloudプロジェクト内のデータストアのリストとその詳細が表示されます。
作成したデータストアまたはデータコネクタがデータストアのリストにあるかどうかを確認します。データストアのリストで、データをストリーミングするデータコネクタには、Cloud Healthcare API FHIR ストアと同じ名前のデータストアが含まれています。
データストアまたはデータコネクタを選択し、詳細を確認します。
- データストアの場合:
  - 概要表には、次の詳細が表示されます。
    - データストアの ID、タイプ、リージョン。
    - インポートされた FHIR リソースの数を示すドキュメントの数。
    - 最後のドキュメントがインポートされたときのタイムスタンプ。
    - 必要に応じて、[詳細を表示] をクリックして、ドキュメントのインポートの詳細（インポートの成功、部分的な成功、失敗など）を確認します。
  - [ドキュメント] タブには、インポートされた FHIR リソースのリソース ID とそのリソースタイプがページネーションされた表に表示されます。このテーブルをフィルタして、特定のリソースがインポートされたかどうかを確認できます。
  - [アクティビティ] タブには、ドキュメントのインポートの詳細（成功、部分的な成功、失敗など）が表示されます。
- データコネクタの場合:
  - 概要表には、次の詳細が表示されます。
    - コレクション ID、タイプ、リージョン。
    - 接続アプリの名前。
    - コネクタの状態（有効または一時停止）。
  - [エンティティ] テーブルには、データコネクタ内のエンティティが表示されます。エンティティの名前は、ソース FHIR ストアの名前です。エンティティの ID は、ソース FHIR ストア名が付加されたデータコネクタの ID です。
    - ポリシー名をクリックして、その詳細を確認します。エンティティはデータコネクタ内のデータストアインスタンスであるため、エンティティの詳細はデータストアの詳細と同じです。
[スキーマ] タブで、サポートされている FHIR リソースと要素のプロパティを表示します。[編集] をクリックしてスキーマを構成します。

REST

データストアの作成を確認します。

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
 "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
DATA_STORE_ID: Vertex AI Search データストアの ID。

レスポンス

次のような JSON レスポンスが返されます。レスポンスには、作成されたデータストアの詳細が含まれます。

{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID",
  "displayName": "DATA_STORE_DISPLAY_NAME",
  "industryVertical": "HEALTHCARE_FHIR",
  "createTime": "DATA_STORE_CREATION_TIMESTAMP",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "defaultParsingConfig": {
      "ocrParsingConfig": {}
    }
  }
}

FHIR データのインポートオペレーションが完了したかどうかを確認します。
```
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
```
次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- DATA_STORE_ID: Vertex AI Search データストアの ID。
- IMPORT_OPERATION_ID: import メソッドの呼び出し時に返される長時間実行オペレーションのオペレーション ID
レスポンス

次のような JSON レスポンスが返されます。インポートオペレーションは長時間実行オペレーションです。オペレーションの実行中、レスポンスには次のフィールドが含まれます。
- successCount: これまでに正常にインポートされた FHIR リソースの数を示します。
- failureCount: これまでにインポートに失敗した FHIR リソースの数を示します。このフィールドは、インポートに失敗した FHIR リソースがある場合にのみ表示されます。
オペレーションが完了すると、レスポンスに次のフィールドが含まれます。
- successCount: 正常にインポートされた FHIR リソースの数を示します。
- failureCount: インポートに失敗した FHIR リソースの数を示します。このフィールドは、インポートに失敗した FHIR リソースがある場合にのみ表示されます。
- totalCount: ソース FHIR ストアに存在する FHIR リソースの数を示します。このフィールドは、インポートに失敗した FHIR リソースがある場合にのみ表示されます。
- done: インポートオペレーションが完了したことを示す値 true があります。
- errorSamples: インポートに失敗したリソースに関する情報を提供します。このフィールドは、インポートに失敗した FHIR リソースがある場合にのみ表示されます。
- errorConfig: エラー概要ログファイルを含む Cloud Storage ロケーションのパスを指定します。
```
{
 "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata",
   "createTime": "START_TIMESTAMP",
   "updateTime": "END_TIMESTAMP",
   "successCount": "SUCCESS_COUNT",
   "failureCount": "FAILURE_COUNT",
   "totalCount": "TOTAL_COUNT",
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsResponse",
  "errorSamples": [ERROR_SAMPLE],
  "errorConfig": {
     "gcsPrefix": "LOG_FILE_LOCATION"
   }
 }
}
```

次のステップ

医療検索アプリを作成し、データストアを接続する。
医療検索アプリで医療データを検索する。
医療データを更新する。

医療検索データストアを作成する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

データ インポートの頻度について

始める前に

データストアを作成してデータをインポートする

このタスクに必要な権限

静的データストアを作成して 1 回限りの一括インポートを実行する

コンソール

REST

レスポンス

レスポンス

レスポンス

Python

データストアを作成する

ドキュメントのインポート

次のステップ

ストリーミング データストアを作成してストリーミング インポートを設定する

コンソール

REST

レスポンス

次のステップ

データストアの作成と FHIR データのインポートを確認する

コンソール

REST

レスポンス

レスポンス

次のステップ

医療検索データストアを作成する

データインポートの頻度について

ストリーミングデータストアを作成してストリーミングインポートを設定する