生成 AI のセキュリティに関するベスト プラクティス

このドキュメントでは、Google Cloudの一般的な生成 AI アーキテクチャについて説明します。また、生成 AI ワークロードに適用可能なセキュリティのベスト プラクティスも示し、特定のGoogle Cloud サービスを使用するタイミングについても説明します。

アーキテクチャ

次の図は、Gemini Enterprise Agent Platform を使用する一般的な生成 AI アーキテクチャの Google Cloud サービスを示しています。

Agent Platform を使用する生成 AI ワークロードのサンプル アーキテクチャ。

この図には次のものが含まれています。

  • Agent Platform を使用すると、AI ソリューション、検索、会話など、生成 AI を単一のプラットフォームで構築して使用できます。

  • Artifact Registry は、機械学習(ML)の開発とデプロイのプロセスを効率化し、コラボレーションを改善し、ML モデルのセキュリティと信頼性を確保します。

  • BigQuery を使用すると、データアクセスが簡素化され、スケーラブルな分析が可能になります。ML ワークフローで ML 機能を使用できます。

  • Cloud Audit Logs は、ユーザーが環境内で行ったアクションを追跡し、トラブルシューティング、監査、インシデント対応の機能を強化します。

  • Cloud Billing のダッシュボードとアラートを使用すると、Agent Platform ワークロードの使用状況と課金を確認できます。

  • Cloud Build を使用すると、 Google Cloudにサーバーレス CI/CD プラットフォームをビルド、テスト、デプロイできます。

  • Cloud Identity は、 Google Cloudの ID、アクセス、アプリケーション、管理を統合します。

  • Cloud Run functions は、タスクの自動化、予測の提供、トレーニング ジョブのトリガー、他のサービスとの統合、イベント ドリブン ML パイプラインの構築を行います。

  • Cloud Storage には、トレーニング データ、モデル アーティファクト、本番環境データが保存されます。

  • Dataflow を使用すると、さまざまなソースからデータを取り込み、必要に応じてデータを集計する複雑なパイプラインを構築できます。

  • Cloud DNS は、ドメインの登録、管理、提供を行います。

  • Identity and Access Management(IAM)は、生成ワークロード リソースに対して特定の操作(作成、編集、削除など)を実行できるユーザーを制御します。

  • 組織のポリシー サービスは、 Google Cloud環境全体でポリシーを一元的に管理し、適用します。組織のポリシーは、組織内のプロジェクトとリソース全体で一貫した構成とセキュリティ コンプライアンスの確保に役立ちます。

  • Pub/Sub を使用すると、機械学習ワークフロー内で効率的な通信と自動化を実現できます。

  • Resource Manager を使用すると、Agent Platform ワークロードの論理コンポーネントをグループ化して管理できます。

  • Secret Manager は、Agent Platform プロジェクトで使用されるセンシティブ データと認証情報の保護に役立ちます。

  • Sensitive Data Protection は、データセット内のセンシティブ データの検出を自動化します。Sensitive Data Protection は、データがモデルに到達する前にプロンプトをスキャンしてセンシティブ データを削除できます。Sensitive Data Protection は、モデルの出力をスキャンして、回答で機密性の高いトレーニング データが漏洩しないようにすることもできます。

  • Security Command Center を使用すると、クラウド組織、AI ワークロード、 Google Cloudに保存する AI データを保護できます。Security Command Center には次の機能があります。

    • セキュリティの一元管理
    • 脅威の検出とインシデント対応
    • セキュリティの自動評価
    • コンプライアンスと規制に関するレポート
    • セキュリティに関する推奨事項とベスト プラクティス
  • Virtual Private Cloud(VPC)は、安全な環境で AI リソースをインターネットから分離します。このネットワーク構成は、センシティブ データとモデルを不正アクセスや潜在的なサイバー攻撃から保護するのに役立ちます。

  • Cloud VPN または Cloud Interconnect を使用すると、オンプレミス インフラストラクチャと Agent Platform 環境の間に安全なネットワーク接続を確立できます。Cloud VPN または Cloud Interconnect を使用すると、プライベート ネットワークと Google Cloudリソース間のデータ転送と通信をシームレスに行うことができます。この統合は、モデル トレーニングのためにオンプレミス データにアクセスしたり、推論のためにオンプレミス リソースにモデルをデプロイするシナリオで検討してください。

生成 AI ワークロードのベスト プラクティス

このセクションでは、Agent Platform を使用する生成 AI ワークロードのベスト プラクティスへのリンクを示します。

Artifact Registry のユースケース

Agent Platform での Artifact Registry のユースケースは次のとおりです。

  • ML アーティファクトを管理する: Artifact Registry を使用すると、モデル トレーニング コード、データセット、トレーニング済みモデル、予測サービング コンテナなど、すべての ML アーティファクトを 1 か所に保存して管理できます。この一元化されたリポジトリを使用して、さまざまなチームやプロジェクトで ML アーティファクトを追跡、共有、再利用できます。
  • バージョン管理と再現性: Artifact Registry は ML アーティファクトのバージョン管理を提供しています。これにより、必要に応じて変更の追跡と以前のバージョンへのロールバックを行うことができます。この機能は、ML テストとデプロイの再現性を確保するために不可欠です。
  • 安全で信頼性の高いストレージ: Artifact Registry は、ML アーティファクト用に安全で信頼性の高いストレージを提供します。これらのアーティファクトは、保存時と転送時に暗号化されます。アクセス制御を構成して、アーティファクトにアクセスできるユーザーを制限し、貴重なデータと知的財産を保護します。
  • Gemini Enterprise Agent Platform Pipelines とのインテグレーション: Artifact Registry を Agent Platform Pipelines と統合して、ML ワークフローを構築し、自動化します。Artifact Registry を使用して、パイプライン アーティファクト(パイプライン定義、コード、データなど)を保存し、新しいアーティファクトがアップロードされたときにパイプライン実行を自動的にトリガーします。
  • ML の CI/CD の合理化: Artifact Registry を CI/CD ツールと統合して、ML モデルの開発とデプロイを合理化します。たとえば、Artifact Registry を使用して、モデルの新しいバージョンを Artifact Registry に push するたびに、モデル サービング コンテナを自動的にビルドしてデプロイします。
  • マルチリージョン サポート: Artifact Registry では、アーティファクトを複数のリージョンに保存できます。これにより、特に世界各地にユーザーがいる場合に、ML モデルのパフォーマンスと可用性を向上させることができます。

BigQuery のユースケース

Agent Platform で BigQuery を使用するユースケースは次のとおりです。

  • シームレスな統合: BigQuery と Agent Platform は緊密に統合されているため、Agent Platform プラットフォーム内でデータに直接アクセスして分析できます。この統合により、データ移動の必要性がなくなり、ML ワークフローが効率化され、負担が軽減されます。
  • スケーラブルなデータ分析: BigQuery はペタバイト規模のデータ ウェアハウスを提供します。インフラストラクチャの制限を気にすることなく、大規模なデータセットを分析できます。このスケーラビリティは、データ集約型の ML モデルのトレーニングとデプロイに不可欠です。
  • SQL ベースの ML: BigQuery ML では、使い慣れた SQL コマンドを使用して、BigQuery 内でモデルを直接トレーニングしてデプロイできます。この機能により、データ アナリストや SQL の実務担当者は、高度なコーディング スキルを必要とせずに ML 機能を使用できます。
  • オンライン予測とバッチ予測: BigQuery ML は、オンライン予測とバッチ予測をサポートしています。個々の行に対してリアルタイム予測を実行することも、バッチモードで大規模なデータセットの予測を生成することもできます。この柔軟性により、レイテンシ要件が異なるさまざまなユースケースに対応できます。
  • データ移動の削減: BigQuery ML を使用すると、モデルのトレーニングとデプロイのためにデータを個別のストレージまたはコンピューティング リソースに移動する必要がなくなります。この移動の削減により、ワークフローが簡素化され、レイテンシが短縮され、データ転送に関連する費用が最小限に抑えられます。
  • モデル モニタリング: Agent Platform は包括的なモデル モニタリング機能を提供し、BigQuery ML モデルのパフォーマンス、公平性、説明可能性を追跡できます。モデル モニタリングは、モデルが期待どおりに動作していることを確認し、潜在的な問題への対処に役立ちます。
  • 事前トレーニング済みモデル: Agent Platform では、自然言語処理やコンピュータ ビジョンなどの事前トレーニング済みモデルにアクセスできます。これらのモデルを BigQuery 内で使用して、分析を強化し、データからより深い分析情報を抽出できます。
  • 費用対効果に優れたソリューション: BigQuery ML は、ML モデルのトレーニングとデプロイを行う費用対効果に優れた柔軟な方法を提供します。使用したリソースに対してのみ課金されるため、あらゆる規模の組織にとって手頃なオプションです。
  • 高度な分析機能: BigQuery には、地理空間分析や予測などの高度な分析を行うためのツールが用意されています。これらのツールを使用すると、ML を他の分析手法と組み合わせて、より詳細なデータ探索と豊富な分析情報を得ることができます。
  • コラボレーションの強化: BigQuery と Agent Platform を併用することで、データ サイエンティスト、ML エンジニア、アナリストは ML プロジェクトでシームレスにコラボレーションできます。このコラボレーションにより、複雑なデータの問題に取り組むための、より統合された効率的なアプローチを構築できます。

Cloud Build のユースケース

Agent Platform での Cloud Build のユースケースは次のとおりです。

  • ML パイプラインのビルドを自動化する: Cloud Build を使用すると、Agent Platform Pipelines で定義された ML パイプラインのビルドとテストを自動化できます。この自動化により、モデルをより迅速かつ一貫性をもって構築し、デプロイできます。
  • デプロイ用のカスタム コンテナ イメージをビルドする: Cloud Build は、モデル サービング環境用のカスタム コンテナ イメージをビルドできます。Cloud Build を使用すると、モデルコード、依存関係、ランタイム環境を 1 つのイメージにパッケージ化して、Gemini Enterprise Agent Platform Inference にデプロイし、予測を提供できます。
  • CI/CD ワークフローと統合する: Cloud Build を使用すると、CI/CD ワークフローで ML モデルのビルドとデプロイを自動化できます。この自動化により、モデルが最新の状態に保たれ、本番環境にデプロイされます。
  • コードの変更に基づいてビルドをトリガーする: モデルコードまたはパイプライン定義が変更されたときに、Cloud Build でビルドを自動的にトリガーできます。この自動化により、モデルが最新のコードでビルドされ、変更が本番環境に自動的にデプロイされます。
  • スケーラブルで安全なインフラストラクチャを構築する: Cloud Build は、スケーラブルで安全なインフラストラクチャを使用してモデルをビルドしてデプロイします。Google Cloud このスケーラビリティにより、独自のインフラストラクチャの管理を心配することなく、モデルの開発に集中できます。
  • さまざまなプログラミング言語のサポート: Cloud Build は、Python、Java、Go、Node.js など、さまざまなプログラミング言語をサポートしています。このサポートにより、任意の言語を使用してモデルを構築できます。
  • ビルド済みのビルドステップを使用する: ビルドプロセスを簡素化するために、Cloud Build には、依存関係のインストール、テストの実行、コンテナ レジストリへのイメージの push など、一般的な ML タスク用にビルドされたビルドステップが用意されています。
  • カスタム ビルドステップを作成する: Cloud Build で独自のカスタム ビルドステップを定義して、ビルドプロセス中に任意のコードを実行できます。
  • 他の Agent Platform サービスのアーティファクトをビルドする: Cloud Build は、Agent Platform の Feature Store や Agent Platform Data Labeling などの他の Agent Platform サービスのアーティファクトをビルドできます。この柔軟性により、Google Cloudで完全な ML ワークフローを構築できます。
  • 費用対効果の高いソリューションを実現する: Cloud Build は従量課金制の料金モデルを提供しているため、使用したリソースに対してのみ料金が発生します。

Cloud Storage のユースケース

Agent Platform での Cloud Storage のユースケースは次のとおりです。

  • トレーニング データを保存する: Agent Platform では、トレーニング データセットを Cloud Storage バケットに保存できます。Cloud Storage を使用すると、次のようなメリットがあります。
    • Cloud Storage はあらゆるサイズのデータセットを処理できるため、ストレージの制限を気にすることなく、大量のデータでモデルをトレーニングできます。
    • Cloud Storage バケットにきめ細かいアクセス制御と暗号化を設定して、機密性の高いトレーニング データを保護できます。
    • Cloud Storage では、変更を追跡してデータの以前のバージョンに戻すことができるため、貴重な監査証跡が提供され、再現可能なトレーニングが容易になります。
    • Agent Platform は Cloud Storage とシームレスに統合されているため、プラットフォーム内でトレーニング データにアクセスできます。
  • モデル アーティファクトを保存する: モデルファイル、ハイパーパラメータ構成、トレーニング ログなどのトレーニング済みモデル アーティファクトを Cloud Storage バケットに保存できます。Cloud Storage を使用すると、次のことができます。
    • 一元化されたリポジトリとして Cloud Storage にすべてのモデル アーティファクトを保存し、簡単にアクセスして管理できるようにします。
    • モデルのさまざまなバージョンを追跡して管理し、必要に応じて比較やロールバックを容易にします。
    • チームメンバーや共同編集者に特定の Cloud Storage バケットへのアクセス権を付与して、モデルを効率的に共有します。
  • プロダクション データを保存する: プロダクションで使用されるモデルの場合、予測のためにモデルに供給されるデータを Cloud Storage に保存できます。たとえば、Cloud Storage を使用して次の操作を行うことができます。
    • ユーザーデータとインタラクションを保存して、パーソナライズされた推奨事項をリアルタイムで提供します。
    • モデルを使用してオンデマンド処理と分類を行うために画像を保持します。
    • モデルを使用して、リアルタイムの不正行為検出用のトランザクション データを維持します。
  • 他のサービスとの統合: Cloud Storage は、Agent Platform ワークフローで使用される他の Google Cloud サービス(次のようなサービス)とシームレスに統合されます。
    • Dataflow。データの前処理と変換のパイプラインを合理化します。
    • BigQuery。モデルのトレーニングと推論のために BigQuery に保存されている大規模なデータセットにアクセスします。
    • Cloud Run functions。モデル予測または Cloud Storage バケットのデータ変更に基づくアクションを実行します。
  • 費用を管理する: Cloud Storage は従量課金制モデルを採用しているため、使用したストレージに対してのみ料金が発生します。このため、特に大規模なデータセットで費用対効果が高くなります。
  • 高可用性と耐久性を有効にする: Cloud Storage は、データの高可用性を確保し、障害や停止からデータを保護します。これにより、信頼性と ML アセットへの堅牢なアクセスが保証されます。
  • マルチリージョン サポートを有効にする: ユーザーまたはアプリケーションの地理的位置に近い複数の Cloud Storage リージョンにデータを保存することで、パフォーマンスを向上させ、データアクセスとモデル予測のレイテンシを短縮します。

Cloud Run functions のユースケース

Agent Platform を使用した Cloud Run functions の次のユースケースを検討してください。

  • データの前処理と後処理: Cloud Run functions は、トレーニングまたは予測のために Agent Platform モデルにデータを送信する前に、データを前処理できます。たとえば、関数はデータのクリーニングと正規化を行ったり、データから特徴を抽出できます。同様に、Cloud Run functions は Agent Platform モデルの出力を後処理できます。たとえば、関数で出力データをフォーマットしたり、別のサービスに送信してさらに分析を行うことができます。
  • Agent Platform トレーニング ジョブを自動的にトリガーする: Agent Platform モデルのトレーニングを自動化するには、Cloud Storage、Pub/Sub、Cloud Scheduler などのさまざまなGoogle Cloud サービスからのイベントを使用して Cloud Run functions をトリガーします。たとえば、新しいファイルが Cloud Storage にアップロードされたときにトリガーされる関数を作成できます。この関数は、新しいデータでモデルをトレーニングする Agent Platform トレーニング ジョブを開始できます。
  • 予測をサービングする: Cloud Run 関数は、Agent Platform モデルから予測をサービングできます。これにより、インフラストラクチャを管理することなく、モデルの API エンドポイントを作成できます。たとえば、画像を入力として受け取り、Agent Platform 画像分類モデルから予測を出力する関数を作成できます。この関数を HTTP API エンドポイントとしてデプロイできます。
  • イベント ドリブン ML ワークフローを構築する: Cloud Run functions を使用して、イベント ドリブン ML ワークフローを構築できます。たとえば、新しいレコードが Pub/Sub トピックに追加されたときに、関数が Agent Platform 予測ジョブをトリガーできます。この関数を使用すると、データをリアルタイムで処理し、モデルの予測に基づいてアクションを実行できます。
  • 他のサービスとの統合: Cloud Run functions を Cloud Storage、BigQuery、Cloud Firestore などの他の Google Cloud サービスと統合できます。インテグレーションにより、さまざまなサービスを接続する複雑な ML パイプラインを構築できます。
  • 費用の合理化: Cloud Run functions では、関数が実行中に使用するリソースに対してのみ料金が発生します。また、Cloud Run functions は需要に合わせて自動的にスケーリングされるため、トラフィックのピーク時に適切なリソースを維持できます。

Pub/Sub のユースケース

Agent Platform での Pub/Sub のユースケースを次に示します。

  • 非同期イベント ドリブン アーキテクチャ: Pub/Sub を使用すると、イベント ドリブン型の通信が可能になり、Pub/Sub トピックに公開されたイベントに基づいて Agent Platform パイプラインをトリガーできます。これらのイベントには、新しいデータとモデルの更新が含まれます。
  • スケーラビリティと信頼性: Pub/Sub はスケーラビリティが高く、パフォーマンスに影響を与えることなく多数のイベントを処理できます。スケーラビリティは、大規模なデータセットの処理や複数の同時 ML ジョブの実行に不可欠です。Pub/Sub は、トピック内の信頼性の高いメッセージ配信と順序付けも行います。ワークロードの負荷が高い場合でも処理の一貫性を確保します。
  • 柔軟性: Pub/Sub を使用して Agent Platform を Cloud Run functions や Dataflow などの他のサービスと統合し、柔軟で動的な ML パイプラインを作成できます。
  • リアルタイムのモニタリングとアラート: Pub/Sub を使用すると、特定のトピックをサブスクライブして、Agent Platform パイプラインのイベントに関するリアルタイム通知を受け取ることができます。リアルタイム モニタリングは、モデルのトレーニングの進行状況、データ前処理の結果、予測出力をモニタリングする際に役立ちます。ジョブの失敗や予測中に検出された異常など、特定のイベントに基づいてアラートを構成できます。アラートを使用すると、事前介入とタイムリーなトラブルシューティングが可能になります。

たとえば、Pub/Sub を使用して次の操作を行うことができます。

  • 新しいデータが Cloud Storage バケットに到着したときにモデルのトレーニングをトリガーする。
  • デプロイされたモデルからダウンストリーム システムにリアルタイム予測を送信して、さらに処理を行う。
  • モデルのパフォーマンス指標の変化をモニタリングして対応する。
  • 予測の失敗やデータ品質の問題などの重大なイベントに関するアラートをトリガーする。

Resource Manager のユースケース

Agent Platform での Resource Manager のユースケースは次のとおりです。

  • リソースとデータの分離と、きめ細かいアクセス制御を確保するために、チームや部門ごとに個別のプロジェクトを作成します。
  • 保護セキュリティ ポリシーを AI ワークロードに適用します。
  • トレーニング ジョブでの GPU 使用量の割り当てを定義して、費用の超過を防ぎます。
  • 新しいプロジェクトに必要な Cloud Storage バケットと Compute Engine インスタンスの作成を自動化します。
  • 特定プロジェクトのリソース使用パターンを追跡して分析し、リソース割り当てを最適化します。
  • 監査レポートを生成して、データ ガバナンスとセキュリティ ポリシーに準拠していることを証明します。

Secret Manager のユースケース

Agent Platform での Secret Manager のユースケースは次のとおりです。

  • モデルのトレーニングで使用される外部データソースにアクセスするための API キーを保存します。
  • 安全なアクセスを実現するため、予測パイプライン内のデータベース認証情報を暗号化します。
  • サービス間の安全な通信のために一時的なアクセス トークンをプロビジョニングします。
  • 通信チャネルの暗号化に使用する秘密鍵と証明書を保護します。
  • ML ワークフローで使用するサードパーティ サービスのパスワードと認証情報を管理します。

VPC のユースケース

Agent Platform での VPC のユースケースは次のとおりです。

  • VPC ネットワーク内できめ細かいファイアウォール ルールとアクセス制御を定義して、トラフィックを制限し、特定のリソースへの承認済み接続のみを許可します。

  • 機能またはセキュリティ要件に基づいて、Agent Platform リソースを個別の VPC ネットワークに整理します。

    このタイプの組織は、リソースを分離し、異なるプロジェクトやチーム間の不正アクセスを防ぐのに役立ちます。機密データを含むモデルのトレーニングなど、機密性の高いワークロード専用の VPC ネットワークを作成し、承認されたユーザーとサービスのみがネットワークにアクセスできるようにします。

次のステップ