Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

グローバルクエリ

グローバルクエリを使用すると、複数のリージョンに保存されているデータを参照する SQL クエリを実行できます。たとえば、us-central1 にあるテーブルと europe-central2 にあるテーブルを結合するグローバルクエリを実行できます。このドキュメントでは、プロジェクトでグローバルクエリを有効にして実行する方法について説明します。

始める前に

プロジェクトでグローバルクエリが有効になっていることを確認し、グローバルクエリを実行するために必要な権限があることを確認します。

グローバルクエリを有効にする

プロジェクトまたは組織でグローバルクエリを有効にするには、 ALTER PROJECT SET OPTIONS ステートメントまたは ALTER ORGANIZATION SET OPTIONS ステートメントを使用して、デフォルト構成を変更します。

リージョンでグローバルクエリを実行するには、クエリを実行している プロジェクトのそのリージョンで、enable_global_queries_execution 引数を true に設定します。
グローバルクエリがリージョンからデータをコピーできるようにするには、データを含む プロジェクトのそのリージョンで、enable_global_queries_data_access 引数を true に設定します。
クエリがリモートテーブルにアクセスするたびに、これらのオプションがチェックされます。
グローバルクエリは 1 つのプロジェクトで実行し、別のプロジェクトの他のリージョンからデータを取得できます。

例: クロスプロジェクト構成

次の例は、別のプロジェクトのテーブルにアクセスするクエリを 1 つのプロジェクトで実行する方法を示しています。

us-central1 リージョンでジョブを実行している query_project プロジェクトがあり、europe-west1 リージョンにあるテーブル data_project.dataset.my_table にアクセスするクエリを実行するとします。

SET @@location='us-central1';
SELECT
  *
FROM
  `query_project.dataset.my_table`
  JOIN `data_project.dataset.my_other_table` USING id;

このグローバルクエリを正常に実行するには、次の構成が必要です。

グローバルクエリを実行するリージョン（us-central1）のプロジェクト（query_project）で、グローバルクエリの実行を有効にする必要があります。
```
ALTER PROJECT `query_project`
SET OPTIONS (
`region-us-central1.enable_global_queries_execution` = TRUE
);
```
データを含むプロジェクト（data_project）のリージョン（europe-west1）で、グローバルクエリによるデータのコピーを有効にする必要があります。
```
ALTER PROJECT `data_project`
SET OPTIONS (
`region-europe-west1.enable_global_queries_data_access` = TRUE
);
```

リモートテーブルを含むビューを作成して使用する場合も、同じ原則が適用されます。クエリを実行するプロジェクトでenable_global_queries_executionが有効になっている必要があります。

これらの ALTER PROJECT オペレーションは、異なるプロジェクトとリージョンを参照するため、個別に実行する必要があります。変更が有効になるまで数分かかることがあります。

必要な権限

グローバルクエリを実行するには、bigquery.jobs.createGlobalQuery 権限が必要です。この権限を含む事前定義ロールは、BigQuery 管理者ロールのみです。BigQuery 管理者ロールを付与せずにグローバルクエリを実行する権限を付与するには、次の操作を行います。

カスタムロール（「BigQuery グローバルクエリ実行者」など）を作成します。
このロールに bigquery.jobs.createGlobalQuery を追加します。
このロールを選択したユーザーまたはサービスアカウントに割り当てます。

データのクエリ

グローバルクエリを実行するには、データが 1 つのロケーションにある場合と同じように SQL クエリを作成します。クエリで参照されるデータが複数のロケーションに保存されている場合、BigQuery はグローバルクエリを実行しようとします。場合によっては、BigQuery はクエリのロケーションを自動的に選択します。それ以外の場合は、クエリを実行するロケーションを指定する必要があります。選択したロケーションにないクエリで参照されるデータは、そのロケーションにコピーされます。

次の例では、2 つの異なるロケーションに保存されている 2 つの異なるデータセットのテーブルを結合するグローバルクエリとして実行されます。

SELECT id, tr_date, product_id, price FROM us_dataset.transactions
UNION ALL
SELECT id, tr_date, product_id, price FROM europe_dataset.transactions

自動ロケーション選択

次の場合、クエリを実行するロケーションは自動的に決定され、変更できません。

データ変更言語クエリ（INSERT、UPDATE、DELETE ステートメント）は、常にターゲットテーブルのロケーションで実行されます。
CREATE TABLE AS SELECT ステートメントなどのデータ定義言語クエリは、常にリソースが作成または変更されるロケーションで実行されます。
宛先テーブルが指定されたクエリは、常に宛先テーブルがあるロケーションで実行されます。

ロケーションを選択してください

通常、グローバルクエリを実行する場所を決定します。決定する際は、次の点を考慮してください。

グローバルクエリは、データをあるロケーションから別のロケーションに一時的にコピーします。組織にデータ所在地の要件があり、ロケーション A のデータをロケーション A から移動させたくない場合は、クエリのロケーションを A に設定します。
ロケーション間で転送されるデータ量を最小限に抑え、クエリの費用を削減するには、クエリ対象データのほとんどが保存されているリージョンでクエリを実行します。

オンラインショップがあり、商品のリストをロケーション us-central1 に保存し、トランザクションを us-south1 リージョンに保存しているとします。カタログ内の商品よりもトランザクションが多い場合は、us-south1 リージョンでクエリを実行する必要があります。

グローバルクエリについて

グローバルクエリを効率的かつ費用対効果の高い方法で実行するには、その実行の仕組みを理解することが重要です。

異なるロケーションにあるデータを使用するには、1 つのロケーションにレプリケートする必要があります。次に、BigQuery が実行するグローバルクエリワークフローの抽象化を示します。

ユーザーの宣言または自動的に、クエリを実行する場所を決定します。このロケーションはプライマリ ロケーションと呼ばれ、クエリで参照される他のすべてのロケーションはリモートです。
各リモートリージョンでサブクエリを実行して、プライマリリージョンでクエリを完了するために必要なデータを収集します。
このデータをリモートロケーションからプライマリロケーションにコピーします。
データをプライマリロケーションの一時テーブルに 8 時間保存します。
プライマリロケーションで収集されたすべてのデータを使用して、最終的なクエリを実行します。
クエリ結果を返します。

BigQuery は、リージョン間で転送されるデータ量を最小限に抑えようとします。たとえば次のようになります。

SET @@location = 'EU';
SELECT
  t1.col1, t2.col2
FROM
  eu_dataset.table1 t1
  JOIN us_dataset.table2 t2 using col3
WHERE
  t2.col4 = 'ABC'

BigQuery は、テーブル t2 のすべてを米国から EU にレプリケートする必要はありません。リクエストされた列（col2 および col3）と、WHERE 条件（t2.col4 = 'ABC'）に一致する行のみを転送すれば十分です。ただし、プッシュダウンと呼ばれるこれらのメカニズムはクエリ構造に依存するため、転送されるデータ量が大きくなることがあります。データの小さなサブセットでグローバルクエリをテストし、必要な場合にのみデータが転送されることを確認することをおすすめします。

オブザーバビリティ

リモートリージョンに送信されたクエリテキストを確認するには、ジョブ履歴を確認します。リモートジョブのジョブ ID は、元のクエリと同じジョブ ID に _xregion サフィックスが付加されたものです。

グローバルクエリを無効にする

プロジェクトまたは組織でグローバルクエリを無効にするには、 ALTER PROJECT SET OPTIONS statement または ALTER ORGANIZATION SET OPTIONS statement を使用して、デフォルト構成を変更します。

リージョンでグローバルクエリを無効にするには、そのリージョンで enable_global_queries_execution 引数を false または NULL に設定します。
グローバルクエリがリージョンからデータをコピーできないようにするには、そのリージョンで enable_global_queries_data_access 引数を false または NULL に設定します。

次の例は、プロジェクトレベルでグローバルクエリを無効にする方法を示しています。

ALTER PROJECT PROJECT_ID
SET OPTIONS (
  `region-REGION.enable_global_queries_execution` = false,
  `region-REGION.enable_global_queries_data_access` = false
);

次のように置き換えます。

PROJECT_ID: 変更するプロジェクトの名前
REGION: グローバルクエリを無効にするリージョンの名前

変更が有効になるまで数分かかることがあります。

料金

グローバルクエリの費用は、次の要素で構成されます。

リモートロケーションのすべてのサブクエリのコンピューティング費用（これらのロケーションの料金モデルに基づく）
実行されるリージョンの最終クエリのコンピューティング費用（そのリージョンの料金モデルに基づく）
データレプリケーションの料金に基づく、異なるロケーション間のデータのコピー費用
ストレージの料金に基づく、リモートリージョンからプライマリリージョンにコピーされたデータの保存費用（8 時間）

割り当て

グローバルクエリに関する割り当てについては、クエリジョブをご覧ください。

制限事項

クエリの実行の詳細と実行グラフには、リモートロケーションから処理および転送されたバイト数は表示されません。この情報は、ジョブ履歴にあるコピージョブに表示されます。グローバルクエリによって作成されたコピージョブのジョブ ID には、クエリジョブのジョブ ID が接頭辞として付加されます。
グローバルクエリはサンドボックスモードではサポートされていません
グローバルクエリは、リージョン間のデータ転送に必要な時間のため、単一リージョンクエリよりもレイテンシが高くなります。
グローバルクエリは、リージョン間のデータ転送を回避するためにキャッシュを使用しません。
グローバルクエリでは、_PARTITIONTIME などの疑似列に対してクエリを実行できません。
グローバルクエリでは、RANGE 型の列に対してクエリを実行できません。
グローバルクエリでは、柔軟な列名を使用して列に対してクエリを実行できません。
グローバルクエリでは、リモートリージョンから INFORMATION_SCHEMA ビューに対してクエリを実行できません。
グローバル承認済みビューと承認済みルーティンはサポートされていません（あるロケーションのビューまたはルーティンが別のロケーションのデータセットにアクセスする権限が付与されている場合）。代わりに、データがあるリージョンに承認済みビューを作成し、グローバルクエリを使用して承認済みビューに対してクエリを実行します。
グローバルクエリに対するマテリアライズドビューはサポートされていません。
グローバルクエリが STRUCT 列を参照している場合、リモートサブクエリにプッシュダウンは適用されません。パフォーマンスを最適化するには、リモートリージョンでビューを作成し、STRUCT 列をフィルタして、必要なフィールドのみを個々の列として返すようにすることをご検討ください。
グローバルクエリはアトミックに実行されません。データレプリケーションは成功したが、クエリ全体が失敗した場合でも、データレプリケーションの料金が請求されます。
グローバルクエリの実行の一部としてリモートリージョンに作成された一時テーブルは、グローバルクエリの結果を暗号化するように構成された CMEK 鍵（テーブル、データセット、プロジェクトレベル）がグローバルである場合にのみ、顧客管理の暗号鍵（CMEK）を使用して暗号化されます。リモート一時テーブルが常に CMEK で保護されるようにするには、リモートリージョンでグローバルクエリを実行するプロジェクトのデフォルトの KMS 鍵を設定します。
グローバルクエリは Assured Workloads ではサポートされていません。
1 つのグローバルクエリは、リージョンごとに最大 10 個のリモートテーブルにアクセスできます。