Gemini in BigQuery がデータを処理する場所

このドキュメントでは、Gemini in BigQuery がデータを処理する場所について説明します。この動作は、次の Gemini in BigQuery 機能に適用されます。

これらの機能では、Gemini の処理はクエリのロケーションの管轄区域内、または BigQuery データセットが保存されている場所で行われます。たとえば、BigQuery クエリのロケーションまたはデータセットが europe-west1 リージョンにある場合、Gemini の処理は EU の管轄区域内のロケーションで行われます。この設計では、データの移動が最小限に抑えられ、データ ガバナンスのベスト プラクティスに沿っています。利用可能な法域の制限について詳しくは、制限事項をご覧ください。

ほとんどの Gemini in BigQuery 機能では、Gemini の処理ロケーションは、プロジェクト レベルまたは組織レベルで グローバル デフォルト ロケーションの設定を使用して管理者が制御できます。BigQuery ユーザーは、BigQuery Studio の [クエリのロケーション] 設定を使用して、このグローバル デフォルトのロケーションをオーバーライドできます。クエリのロケーション設定が管理者によって構成設定で指定されていない場合、またはユーザーによってクエリで明示的に指定されていない場合、Gemini in BigQuery は編集中のクエリから派生したロケーションを使用します。BigQuery がクエリのロケーションを決定する方法については、クエリを実行するをご覧ください。

Gemini in BigQuery は、これらの制御に基づいて US または EU の管轄区域を決定します。管轄区域を特定できない場合は、Gemini のサービス提供地域に基づいてグローバル処理地域が使用されます。

以降のセクションでは、各 Gemini in BigQuery 機能がデータを処理する場所を管理する方法について説明します。

SQL エディタとデータ キャンバス

SQL エディタを使用してコードを生成する場合や、データ キャンバスを使用してデータ分析ワークフローを作成する場合、Gemini in BigQuery は次のロジックを使用して処理場所を決定します。

  • BigQuery 管理者は、組織レベルまたはプロジェクト レベルのデフォルトのロケーションを指定できます。デフォルトのロケーションを指定する方法については、デフォルトの組織レベルまたはプロジェクト レベルのロケーションを指定するをご覧ください。

  • BigQuery ユーザーは、BigQuery Studio でクエリのロケーションを指定して、管理者の設定をオーバーライドできます。BigQuery でデフォルトのクエリ ロケーション設定を指定する方法については、ロケーションを指定するをご覧ください。

  • データセットのロケーションを特定できない場合、またはユーザーのデフォルトのクエリ ロケーションが指定されていない場合、BigQuery はドライランに基づいてデータセットまたはクエリのロケーションを特定しようとします。次に例を示します。

    • SQL エディタの例: Gemini を使用して SQL を変換するという Gemini リクエストで europe-west1 のデータセットが参照されている場合、Gemini は EU の管轄区域の境界内のデータを処理します。
    • データ キャンバスの例: データ キャンバスが us-east4 にあるデータセットのデータを可視化する場合、Gemini in BigQuery の分析や提案は US の管轄区域内で処理されます。

デフォルトの組織レベルまたはプロジェクト レベルのロケーションを指定する

BigQuery 管理者は、Gemini リクエストが処理される組織レベルまたはプロジェクト レベルのデフォルトのロケーションを指定できます。デフォルトの場所は、ユーザーが現在の SQL エディタタブ内で編集している間、セッションの期間中キャッシュに保存されます。

前提条件

データが処理される組織レベルまたはプロジェクト レベルのデフォルトのロケーションを指定するには、BigQuery 管理者がまず、このフォームに記入して BigQuery 機能を有効にする必要があります。その後、機能が有効になったことを確認するメールが届きます。

必要なロール

デフォルトの組織またはプロジェクトのロケーションを指定するには、構成設定の指定に必要な bigquery.config.update 権限を含む BigQuery 管理者ロールroles/bigquery.admin)が付与されている必要があります。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

デフォルトの場所を設定する

組織レベルまたはプロジェクト レベルのデフォルトのロケーションを設定する手順は次のとおりです。

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] に移動

  2. ナビゲーション パネルで、 [エクスプローラ] をクリックします。

  3. デフォルトのロケーションを指定する組織またはプロジェクトを選択します。

  4. BigQuery SQL エディタで、次のステートメントを入力します。

    • 組織レベルの設定:
      ALTER ORGANIZATION SET OPTIONS(default_location='my-default-region');
    • プロジェクト レベルの設定:
      ALTER PROJECT SET OPTIONS(default_location='my-default-region');

このコマンドは、default_location の値を my-default-region に設定します。

データ処理のデフォルトのロケーションを確認する

Gemini in BigQuery の支援機能を使用した SQL クエリのデータ処理のデフォルトのロケーションを確認する手順は次のとおりです。

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] に移動

  2. BigQuery Studio SQL エディタで、次のクエリを実行します。

    SELECT
        COALESCE(
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.PROJECT_OPTIONS
                WHERE option_name = 'default_location'
            ),
            (
                SELECT
                    option_value
                FROM INFORMATION_SCHEMA.ORGANIZATION_OPTIONS
                WHERE option_name = 'default_location'
            ));

結果には、my-default-region として定義した値に設定された default_location 値が表示されます。このクエリは、プロジェクトのデフォルトのロケーションが定義されている場合は、そのロケーションを返します。それ以外の場合、クエリは組織のデフォルトのロケーションを返します。Gemini in BigQuery オペレーションが実行されるロケーションがユーザーによって明示的に指定されていません。

BigQuery データ インサイト

BigQuery データ分析情報を使用して分析情報を生成するには、選択したテーブルとデータセット リソースでデータ スキャン オペレーションを実行します。これらのスキャンは、BigQuery データセット リソースと同じ場所に作成されます。US または EU の法域内では、Gemini in BigQuery の処理はスキャンが実行される法域に制限されます。USEU の管轄外では、処理はグローバルに実行されます。Gemini のグローバル データ処理が行われる場所については、Gemini のサービス提供地域をご覧ください。

BigQuery データの準備

BigQuery データ準備でデータが処理されるロケーションは、使用しているデータ準備機能によって異なります。

  • スタンドアロンのデータ準備の場合、Gemini in BigQuery の処理ロケーションは、BigQuery データセットが配置されているロケーションです。
  • Dataform または BigQuery パイプラインの一部としてデータ準備を実行する場合、Gemini in BigQuery のデータ処理ロケーションは、Dataform の defaultLocation 設定(設定されている場合)によって決まります。defaultLocation 設定は、BigQuery ジョブのロケーションも決定します。これにより、Gemini in BigQuery の処理が同じ管轄区域内で行われます。
  • Dataform の defaultLocation またはデータ準備を含む BigQuery パイプラインが設定されていない場合、Gemini in BigQuery の処理リージョンは、リポジトリのリージョン設定を使用して決定されます。defaultLocation 設定が指定されていないパイプラインは、パイプライン ノードで使用されるテーブルのロケーションに基づいて、さまざまなロケーションでさまざまな BigQuery ジョブを実行できます。ベスト プラクティスとして、一貫した処理ロケーションを確保するために defaultLocation を設定することをおすすめします。

制限事項

Gemini in BigQuery がデータを処理する場所を特定する場合は、次の制限事項が適用されます。

  • Gemini in BigQuery は、個々のロケーションのデータ所在地を提供しません。データ処理は、USEU でサポートされている法域で指定できます。これらの法域外のデータはグローバルに処理されます。
  • Gemini in BigQuery の管轄区域処理は、一般提供(GA)の Gemini in BigQuery 機能でのみ使用できます。Gemini in BigQuery の機能の一覧については、Gemini in BigQuery の概要をご覧ください。
  • BigQuery の BigQuery Python ノートブック コード アシストと Colab Enterprise 用の Data Science Agent は、グローバル Gemini 処理のみをサポートしています。

  • Gemini in Cloud Assist チャット(GCA)は、グローバル Gemini 処理のみをサポートしています。ユーザーの cloudaicompanion.instances.completeTask Identity and Access Management(IAM)権限を削除すると、GCA チャット パネルへのアクセスを拒否できます。カスタムロールの作成方法については、カスタムロールの作成と管理をご覧ください。

次のステップ