このページでは、Gemini Enterprise Agent Platform の TensorFlow インテグレーションについて説明します。また、Gemini Enterprise Agent Platform で TensorFlow を使用する方法を示すリソースについて紹介します。Gemini Enterprise Agent Platform の TensorFlow インテグレーションを使用すると、本番環境での TensorFlow モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。
ノートブックでコードを実行する
Agent Platform には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。 これらのオプションの詳細については、 ノートブック ソリューションを選択するをご覧ください。
トレーニング用のビルド済みコンテナ
Gemini Enterprise Agent Platform には、モデル トレーニング用にビルド済みの Docker コンテナ イメージが用意されています。 これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、トレーニング コードで必要となる一般的な依存関係が含まれています。
ビルド済みのトレーニング コンテナを使用する TensorFlow バージョンと、ビルド済みのトレーニング コンテナでモデルをトレーニングする方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
分散トレーニング
Gemini Enterprise Agent Platform では、TensorFlow モデルの分散トレーニングを実行できます。マルチワーカー トレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Gemini Enterprise Agent Platform での 分散トレーニングの詳細については、 分散トレーニングをご覧ください。
推論用のビルド済みコンテナ
トレーニング用のビルド済みコンテナと同様に、Gemini Enterprise Agent Platform では、Gemini Enterprise Agent Platform 内外で作成した TensorFlow モデルから推論と説明をサービングするためのビルド済みコンテナ イメージが用意されています。これらのイメージは、最小限の構成で推論を行うことができる HTTP 推論サーバーを提供します。
ビルド済みのトレーニング コンテナを使用する TensorFlow バージョンと、ビルド済みのトレーニング コンテナでモデルをトレーニングする方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
最適化された TensorFlow ランタイム
TensorFlow Cloud Profiler の統合
Gemini Enterprise Agent Platform の TensorFlow Cloud Profiler インテグレーションを使用してトレーニング ジョブのパフォーマンスをモニタリングして最適化することで、コストを抑えながらモデルのトレーニングを迅速に行うことができます。TensorFlow Cloud Profiler を使用すると、トレーニング オペレーションのリソース消費量を把握し、パフォーマンスのボトルネックを特定して排除できます。
Agent Platform TensorFlow Cloud Profiler の詳細については、Profiler を使用してモデルのトレーニング パフォーマンスをプロファイリングする をご覧ください。
Gemini Enterprise Agent Platform で TensorFlow を使用するためのリソース
Gemini Enterprise Agent Platform での TensorFlow の詳細と使用方法については、次のリソースをご覧ください。
プロトタイプから 本番環境へ: Gemini Enterprise Agent Platform でカスタム TensorFlow モデルを開発して デプロイするエンドツーエンドの例を示す動画シリーズ。
Gemini Enterprise Agent Platform で Reduction Server を使用してトレーニング パフォーマンスを最適化する: Reduction Server を使用して Gemini Enterprise Agent Platform の分散トレーニングを最適化する方法に関するブログ投稿。
Gemini Enterprise Agent Platform で TensorFlow Cloud Profiler を使用してトレーニングのパフォーマンスを最適化する方法: Gemini Enterprise Agent Platform TensorFlow Cloud Profiler を使用して、トレーニング ジョブのパフォーマンスのボトルネックを特定する方法を説明するブログ投稿。
特徴フィルタリングを使用したカスタムモデル バッチ予測: Agent Platform SDK for Python を使用してカスタム表形式分類モデルをトレーニングし、特徴フィルタリングでバッチ推論を実行する方法を紹介するノートブック チュートリアル。
Agent Platform Pipelines: ビルド済みの Google Cloud パイプライン コンポーネントを使用したカスタム トレーニング: カスタム トレーニング用に、ビルド済みの パイプライン コンポーネントで Gemini Enterprise Agent Platform Pipelines を使用する方法を紹介するノートブック チュートリアル。 Google Cloud
予測用に同じ VM 上で TensorFlow モデルを共同ホストする: Gemini Enterprise Agent Platform で共同ホスティング モデル機能を使用して、オンライン推論のために同じ VM 上に複数のモデルをホストする方法を示す Codelab。