このページでは、Storage Insights のデータセット構成を管理して、データのソース、スコープ、保持を制御する方法について説明します。構成の表示、一覧表示、更新、削除の方法と、リンクされたデータセットの表示、クエリ、リンク解除の方法について説明します。
必要なロールを取得する
データセット構成の管理に必要な権限を取得するには、ソース プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。
-
データセット構成の一覧表示、更新、削除、表示を行う: Storage Insights 管理者 (
roles/storageinsights.admin) -
データセットを表示してリンクを解除する:
- Storage Insights アナリスト(
roles/storageinsights.analyst) -
BigQuery 管理者(
roles/bigquery.admin)
- Storage Insights アナリスト(
-
リンクされたデータセットを削除する: BigQuery 管理者(
roles/bigquery.admin) -
BigQuery でデータセットを表示してクエリを実行する:
-
Storage Insights 閲覧者(
roles/storageinsights.viewer) -
BigQuery ジョブユーザー(
roles/bigquery.jobUser) -
BigQuery データ閲覧者(
roles/bigquery.dataViewer)
-
Storage Insights 閲覧者(
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
これらの事前定義ロールには、データセット構成の管理に必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
データセット構成を管理するには、次の権限が必要です。
-
データセットの構成を表示して一覧表示する:
-
storageinsights.datasetConfigs.get -
storageinsights.datasetConfigs.list -
storage.buckets.getObjectInsights
-
-
データセット構成を更新して削除する:
-
storageinsights.datasetConfigs.update -
storageinsights.datasetConfigs.delete -
storage.buckets.getObjectInsights
-
-
BigQuery データセットへのリンクを解除する:
storageinsights.datasetConfigs.unlinkDataset -
BigQuery のリンクされたデータセットに対してクエリを実行する:
bigquery.jobs.create or bigquery.jobs.*
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
リンクされたデータセットを表示してクエリする
リンクされたデータセットを表示してクエリを実行する手順は次のとおりです。
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
プロジェクトに、作成されたデータセット構成のリストが表示されます。
表示するデータセット構成で BigQuery とリンクされたデータセットをクリックします。
Google Cloud コンソールに BigQuery とリンクされたデータセットが表示されます。メタデータのデータセット スキーマについては、メタデータのデータセット スキーマをご覧ください。
他の BigQuery テーブルに対してクエリを実行するのと同じ方法で、リンクされたデータセット内のテーブルとビューに対してクエリを実行できます。
データセットのリンクを解除する
データセットの構成が BigQuery データセットに公開されないようにするには、データセットのリンクを解除します。データセットのリンクを解除するには、次の操作を行います。
コンソール
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
リンクを解除するデータセットを生成したデータセット構成の名前をクリックします。
[BigQuery とリンクされたデータセット] セクションで、[データセットのリンクを解除] をクリックします。
コマンドライン
データセットのリンクを解除するには、
gcloud storage insights dataset-configs delete-linkコマンドを実行します。gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
次のように置き換えます。
DATASET_CONFIG_IDは、リンクを解除するデータセットを生成したデータセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションに置き換えます。例:us-central1
データセット構成の完全なパスを指定することもできます。次に例を示します。
gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
次のように置き換えます。
DESTINATION_PROJECT_IDは、データセット構成を含むプロジェクトの ID に置き換えます。プロジェクト ID の詳細については、プロジェクトの作成と管理をご覧ください。DATASET_CONFIG_IDは、リンクを解除するデータセットを生成したデータセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションに置き換えます。例:us-central1
JSON API
gcloud CLI をインストールして初期化します。これにより、
Authorizationヘッダーのアクセス トークンを生成できます。次の情報が含まれる JSON ファイルを作成します。
{ "name": "DATASET_NAME" }
次のように置き換えます。
DATASET_NAMEは、リンクを解除するデータセットの名前に置き換えます。例:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2。cURLを使用してunlinkDatasetDatasetConfig リクエストで JSON API を呼び出します。curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
次のように置き換えます。
JSON_FILE_NAMEは、前の手順で作成した JSON ファイルのパスに置き換えます。PROJECT_IDは、データセット構成が属するプロジェクトの ID に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1。DATASET_CONFIG_IDは、リンクを解除するデータセットを生成したデータセット構成の名前に置き換えます。SERVICE_ACCOUNT: サービス アカウント。例:test-service-account@test-project.iam.gserviceaccount.com
データセット構成を表示する
データセット構成を表示するには、次の操作を行います。
コンソール
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
表示するデータセット構成の名前をクリックします。
データセット構成の詳細が表示されます。
コマンドライン
データセット構成を説明するには、
gcloud storage insights dataset-configs describeコマンドを実行します。gcloud storage insights dataset-configs describe DATASET_CONFIG_ID \ --location=LOCATION
次のように置き換えます。
DATASET_CONFIG_IDは、データセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。
データセット構成の完全なパスを指定することもできます。次に例を示します。
gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
次のように置き換えます。
DESTINATION_PROJECT_IDは、データセット構成を含むプロジェクトの ID に置き換えます。プロジェクト ID の詳細については、プロジェクトの作成と管理をご覧ください。DATASET_CONFIG_IDは、表示するデータセットを生成したデータセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションに置き換えます。例:us-central1
JSON API
gcloud CLI のインストールと初期化を行います。これにより、
Authorizationヘッダーのアクセス トークンを生成できます。cURLを使用してGetDatasetConfig リクエストで JSON API を呼び出します。curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
次のように置き換えます。
PROJECT_IDは、データセット構成が属するプロジェクトの ID に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1。DATASET_CONFIG_IDは、データセット構成の名前に置き換えます。SERVICE_ACCOUNT: サービス アカウント。例:test-service-account@test-project.
データセットの構成を一覧取得する
プロジェクト内のデータセット構成を一覧表示するには、次の操作を行います。
コンソール
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
データセット構成のリストが表示されます。
コマンドライン
プロジェクト内のデータセット構成を一覧表示するには、
gcloud storage insights dataset-configs listコマンドを実行します。gcloud storage insights dataset-configs list --location=LOCATION
次のように置き換えます。
LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1。
次のオプションのフラグを使用して、リスト呼び出しの動作を指定できます。
--page-sizeを使用して、ページごとに返す結果の最大数を指定します。--filter=FILTERを使用して結果をフィルタします。--filterフラグの使用方法の詳細については、gcloud topic filtersを実行してドキュメントをご覧ください。--sort-by=SORT_BY_VALUEを使用して、並べ替えるリソース フィールド キー名のカンマ区切りのリストを指定します。例:--sort-by=DATASET_CONFIG_ID
JSON API
gcloud CLI のインストールと初期化を行います。これにより、
Authorizationヘッダーのアクセス トークンを生成できます。cURLを使用して、GetDatasetConfig リクエストで JSON API を呼び出します。curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
次のように置き換えます。
PROJECT_IDは、データセット構成が属するプロジェクトの ID に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1SERVICE_ACCOUNT: サービス アカウント。例:test-service-account@test-project.iam.gserviceaccount.com
データセット構成を更新する
データセットの構成を更新する手順は次のとおりです。
コンソール
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
更新するデータセット構成の名前をクリックします。
[データセットの構成] タブで、[編集] をクリックしてフィールドを更新します。
コマンドライン
データセット構成を更新するには、
gcloud storage insights dataset-configs updateコマンドを実行します。gcloud storage insights dataset-configs update DATASET_CONFIG_ID \ --location=LOCATION
次のように置き換えます。
DATASET_CONFIG_IDは、データセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。
次のフラグを使用して、データセット構成のプロパティを更新します。
--skip-verificationを使用して、検証プロセスからチェックとエラーをスキップします。これには、必要な IAM 権限のチェックが含まれます。使用すると、一部またはすべてのバケットがデータセットから除外される可能性があります。--retention-period-days=DAYSを使用して、データセット スナップショットでキャプチャするデータの移動日数を指定します。例:90--activity-data-retention-period-days=ACTIVITY_RETENTION_PERIOD_DAYSを使用して、データセット内のアクティビティ データの保持期間を指定します。デフォルトでは、アクティビティ データはデータセットに含まれ、データセットの保持期間を継承します。データセットの保持期間をオーバーライドするには、アクティビティ データを保持する日数を指定します。アクティビティ データを除外するには、ACTIVITY_RETENTION_PERIOD_DAYS を0に設定します。--description=DESCRIPTIONを使用して、データセット構成の説明を記述します。--organization=ORGANIZATION_IDを使用して、ソース プロジェクトの組織 ID を指定します。指定しない場合、デフォルトでソース プロジェクトの組織 ID になります。
JSON API
gcloud CLI のインストールと初期化を行います。これにより、
Authorizationヘッダーのアクセス トークンを生成できます。次のオプション情報を含む JSON ファイルを作成します。
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": "RETENTION_PERIOD", "activityDataRetentionPeriodDays": "ACTIVITY_DATA_RETENTION_PERIOD_DAYS" }
次のように置き換えます。
ORGANIZATION_IDは、ソース プロジェクトが属する組織のリソース ID に置き換えます。指定しない場合、デフォルトでソース プロジェクトの組織 ID になります。PROJECT_NUMBERSは、データセットに含めるプロジェクト数に置き換えます。1 つ以上のプロジェクトをリスト形式で指定できます。RETENTION_PERIODは、データセット スナップショットでキャプチャするデータの移動日数に置き換えます。例:90ACTIVITY_DATA_RETENTION_PERIOD_DAYSは、データセット スナップショットでキャプチャするアクティビティ データの日数に置き換えます。デフォルトでは、アクティビティ データはデータセットに含まれ、データセットの保持期間を継承します。データセットの保持期間をオーバーライドするには、アクティビティ データを保持する日数を指定します。アクティビティ データを除外するには、ACTIVITY_RETENTION_PERIOD_DAYS を0に設定します。
データセットの構成を更新するには、
cURLを使用して、PatchDatasetConfig リクエストで JSON API を呼び出します。curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=UPDATE_MASK" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
次のように置き換えます。
JSON_FILE_NAMEは、前の手順で作成した JSON ファイルのパスに置き換えます。PROJECT_IDは、データセット構成が属するプロジェクトの ID に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1。DATASET_CONFIG_IDは、更新するデータセット構成の名前に置き換えます。UPDATE_MASKは、このリクエストで更新するフィールド名のカンマ区切りのリストです。これらのフィールドは fieldMask 形式で、DatasetConfigリソースの一部です。SERVICE_ACCOUNT: サービス アカウント。例:test-service-account@test-project.iam.gserviceaccount.com
データセット構成を削除する
データセット構成を削除するには、次の操作を行います。
コンソール
- Google Cloud コンソールで、Cloud Storage の [Storage Insights] ページに移動します。
削除するデータセット構成の名前をクリックします。
[削除] をクリックします。
コマンドライン
データセット構成を削除するには、
gcloud storage insights dataset-configs deleteコマンドを実行します。gcloud storage insights dataset-configs delete DATASET_CONFIG_ID \ --location=LOCATION
次のように置き換えます。
DATASET_CONFIG_IDは、削除するデータセット構成の名前に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1
次のフラグを使用して、データセット構成を削除します。
--auto-delete-linkを使用して、削除するデータセット構成から生成されたデータセットのリンクを解除します。データセットを生成したデータセット構成を削除する前に、データセットのリンクを解除する必要があります。
データセット構成の完全なパスを指定することもできます。次に例を示します。
gcloud storage insights dataset-configs delete projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
JSON API
gcloud CLI のインストールと初期化を行います。これにより、
Authorizationヘッダーのアクセス トークンを生成できます。cURLを使用してDeleteDatasetConfig リクエストで JSON API を呼び出します。curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"次のように置き換えます。
PROJECT_IDは、データセット構成が属するプロジェクトの ID に置き換えます。LOCATIONは、データセットとデータセット構成のロケーションで置き換えます。例:us-central1。DATASET_CONFIG_IDは、削除するデータセット構成の名前に置き換えます。SERVICE_ACCOUNT: サービス アカウント。例:test-service-account@test-project.iam.gserviceaccount.com