このページでは、Vertex AI で使用する Sensitive Data Protection の検出について説明します。
Sensitive Data Protection の検出機能を使用すると、Vertex AI トレーニング データセットとチューニング ジョブに含まれるデータについて学習できます。検出では、検出された情報タイプ(infoTypes)や、モデルのトレーニングとチューニングに使用するデータの機密性レベルなどの分析情報を提供するデータ プロファイルが生成されます。
利点
この機能には次の利点があります。
- Vertex AI データセットとチューニング ジョブを組織、フォルダ、プロジェクト レベルでモニタリングして機密データを検出し、結果をレポートできます。
- 検出で機密性の高いトレーニング データまたはチューニング データが検出された場合は、データ プロファイルを使用して、さらに調査する必要があるリソースを特定できます。詳細な検査を実行して、リソース内のすべての機密情報インスタンスを見つけることができます。
- 検出結果を Security Command Center に送信すると、組織のセキュリティ体制を評価する際に、機密データが含まれている可能性のある AI 関連のワークロードが考慮されます。
サポートされているデータソース
この機能では、Vertex AI データセットとチューニング ジョブで参照される次の種類のデータのプロファイルを作成できます。
- Cloud Storage バケット内のトレーニング データとチューニング データ。サポートされているファイル形式については、ファイル クラスタをご覧ください。
- BigQuery テーブルのトレーニング データ。
仕組み
Vertex AI データセットのプロファイリングを行うと、トレーニング データの保存場所(Cloud Storage バケットまたは BigQuery テーブル)に応じて、Sensitive Data Protection がファイル ストア データ プロファイルまたはテーブル データ プロファイルを生成します。
Vertex AI チューニング ジョブのプロファイリングを行うと、機密データの保護によってファイル ストア データ プロファイルが生成されます。
データ プロファイルは、プロファイリングしたリソースに関する分析情報とメタデータを提供します。生成されたデータ プロファイルには、Vertex AI データセットまたはチューニング ジョブごとに次の情報が含まれます。
- トレーニング データまたはチューニング データの機密レベルとデータリスク レベル
- トレーニング データまたはチューニング データで検出された機密情報の種類(運転免許証の ID やメールアドレスなど)
各ファイルストア データ プロファイルに含まれる分析情報とメタデータの完全なリストについては、ファイルストア データ プロファイルをご覧ください。
各テーブルデータ プロファイルに含まれる分析情報とメタデータの完全なリストについては、テーブルデータ プロファイルをご覧ください。
検出サービスの詳細については、データ プロファイルをご覧ください。
料金
データをプロファイリングすると、選択した検出の料金モードに従って、Sensitive Data Protection の料金が発生します。
また、トレーニング データまたはチューニング データが Cloud Storage バケットにある場合、Sensitive Data Protection がデータのプロファイリングを行うリクエストに対して Cloud Storage から課金されます。以降のセクションでは、発生する Cloud Storage の関連料金について説明します。
クラス B オペレーション
Sensitive Data Protection が Cloud Storage バケット内のデータのプロファイリングを行うプロセスで実行するクラス B(storage.buckets.get)オペレーションに対して課金されます。
Cloud Storage がクラス B オペレーションに対して請求する料金については、Cloud Storage ドキュメントのオペレーション料金をご覧ください。
検索料金
Standard 以外のストレージ クラスのオブジェクトには、取得料金が課金されます。Cloud Storage でのデータ取得の料金については、Cloud Storage のドキュメントの取得料金をご覧ください。