このドキュメントでは、 Google Cloudで生成 AI ワークロードを実行する際の Dataflow のベスト プラクティスとガイドラインについて説明します。Vertex AI で Dataflow を使用して、さまざまなソースからデータを取り込み、必要に応じてデータを集計する複雑なパイプラインを構築します。
オプションの Dataflow コントロール
データソースに応じて、次のセキュリティ コントロールを実装することをおすすめします。
Dataflow ジョブの外部 IP アドレスをオフにする
| Google コントロール ID | DF-CO-6.1 |
|---|---|
| カテゴリ | オプション |
| 説明 | Dataflow ジョブに関連する管理タスクとモニタリング タスクの外部 IP アドレスをオフにします。代わりに、SSH を使用して Dataflow ワーカー VM へのアクセスを構成します。 プライベート Google アクセスを有効にして、Dataflow ジョブで次のいずれかのオプションを指定します。
ここで
|
| 対象プロダクト |
|
| 関連する NIST-800-53 コントロール |
|
| 関連する CRI プロファイル コントロール |
|
| 関連情報 |
ファイアウォール ルールにネットワーク タグを使用する
| Google コントロール ID | DF-CO-6.2 |
|---|---|
| カテゴリ | オプション |
| 説明 | ネットワーク タグは、Dataflow ワーカー VM などの Compute Engine VM に付加されるテキスト属性です。ネットワーク タグを使用すると、VPC ネットワーク ファイアウォール ルールと一部のカスタム静的ルートを特定の VM インスタンスに適用できます。Dataflow では、特定の Dataflow ジョブを実行するすべてのワーカー VM にネットワーク タグを追加できます。 |
| 対象プロダクト |
|
| 関連する NIST-800-53 コントロール |
|
| 関連する CRI プロファイル コントロール |
|
| 関連情報 |