Google Distributed Cloud(GDC)エアギャップ アプライアンス上の Vertex AI は、ML(機械学習)と AI(人工知能)プラットフォームの機能を安全なポータブル デバイスにもたらします。GDC エアギャップ アプライアンスは、事前トレーニング済みの Vertex AI API の一部にアクセスできるため、プライベート クラウド ソリューションで AI 機能を有効にできます。
主な機能
GDC エアギャップ アプライアンスの Vertex AI には、次の機能があります。
- エアギャップ デプロイ: Vertex AI サービスをポータブル デバイス内で完全に実行し、データ主権とコンプライアンスを確保します。
- 使い慣れた Vertex AI の操作性: Google Cloudと同じツールと API を活用して、開発と管理を簡素化します。
- 事前構築済みのモデルとアルゴリズム: 一般的な ML タスクに対応した事前トレーニング済みモデルにアクセスして、価値実現までの時間を短縮できます。
利用可能なサービス
GDC のエアギャップ アプライアンス上の Vertex AI では、次の事前トレーニング済みサービスが提供されます。
- 光学式文字認識(OCR): 画像やファイルからテキストを抽出します。
- Speech-to-Text: 音声をテキストに変換します。
- Vertex AI Translation: 複数の言語間でテキストを翻訳します。
キャパシティ プランニングとコンピューティング要件
Vertex AI サービスごとに異なるコンピューティング リソースが必要です。次の表に、各事前トレーニング済みモデルの要件を示します。
事前トレーニング済み API | コンピューティング リソース | GPU 数の要件 | GPU メモリ要件 |
---|---|---|---|
光学式文字認識(OCR) | GPU | 1 つの A100 80 GB GPU | 40 GB |
Speech-to-Text | CPU | 該当なし(CPU のみ) | 該当なし(CPU のみ) |
Vertex AI Translation | GPU | 1 つの A100 80 GB GPU | 50 GB |
GDC エアギャップ アプライアンスには、NVIDIA A100 80 GB GPU が 1 つ含まれています。これにより、デバイスは一度に 1 つの GPU 依存の Vertex AI 事前トレーニング済み API のみ実行できます。Vertex AI Translation と OCR の両方を有効にしようとすると、2 番目の API は有効にならず、GPU リソースが不足していることを示すエラー メッセージが表示されます。ただし、Speech-to-Text は CPU リソースのみを必要とするため、Vertex AI Translation または OCR とともに実行できます。
AI/ML ワークロードに必要なアプライアンス ユニットの数を判断するには、各 Vertex AI 事前トレーニング済み API の容量上限を確認してください。
事前トレーニング済み API | アプライアンス ユニットあたりの容量 |
---|---|
光学式文字認識(OCR) | 1 分あたり最大 30 枚(2 秒ごとに 1 枚)。 |
Speech-to-Text | 1 分あたり最大 7 分の音声の文字起こし(1 秒あたり 7 秒の音声の文字起こし)。 |
Vertex AI Translation | 1 分あたり最大 61,000 文字(1 秒あたり 1,024 文字)。 |
デプロイを計画する際は、次のガイダンスを考慮してください。
容量上限は概算であり、保証されるものではありません。実際の容量は、次のような要因によって異なる場合があります。
- 入力データの複雑さ(翻訳の言語、OCR の画像品質、音声文字変換の音声の明瞭さなど)。
- アプライアンスの特定の構成。
- アプライアンスでの他のサービスの同時使用。
GDC エアギャップ アプライアンスは単一の A100 80 GB GPU に制限されているため、一度にアクティブにできる GPU を多用する API(Vertex AI Translation または OCR)は 1 つのみです。
ピーク時の使用量と将来の増加の可能性を見積もります。
高いスループットを必要とする負荷の高いワークロードの場合は、複数のアプライアンス ユニットのデプロイを検討してください。
次の表に、GDC エアギャップ アプライアンス上の各 Vertex AI サービスのストレージ要件を示します。
コンポーネント | ストレージ要件 |
---|---|
OCR フロントエンド | 0.1 GB |
OCR バックエンド | 5 GB |
OCR エクストラクタ | 0.1 GB |
Speech-to-Text フロントエンド | 0.1 GB |
Speech-to-Text バックエンド | 1.5 GB |
Vertex AI Translation フロントエンド | 0.7 GB |
Vertex AI Translation バックエンド | 61.4 GB |
使用する Vertex AI サービスに対応できる十分なストレージ容量がアプライアンスにあることを確認します。
利点
GDC エアギャップ アプライアンス上の Vertex AI には、次のメリットがあります。
- シームレスな開発エクスペリエンス: Google Cloudで Vertex AI の同じツール、API、ワークフローを使用することで、開発と管理を直感的かつ効率的に行うことができます。
- 強化されたセキュリティとプライバシー: データを完全に制御し、規制要件を遵守します。
- 価値創出までの時間を短縮: 一般的な ML タスクに事前トレーニング済みモデルを使用します。
- MLOps の合理化: 強力な ML オペレーション機能を利用して、エアギャップ環境内で AI をシームレスに統合できます。
ご利用にあたって
GDC エアギャップ アプライアンスで Vertex AI を使用するには、次の操作を行います。
- 利用可能なサービスの基本的なロールと権限について学習する。
- AI と ML のワークロード用にプロジェクトを設定する。
- GPU をプロビジョニングして Vertex AI サービスを有効にします。
- Vertex AI クライアント ライブラリをインストールします。