TensorFlow インテグレーション

このページでは、Gemini Enterprise Agent Platform の TensorFlow インテグレーションについて説明します。また、Gemini Enterprise Agent Platform で TensorFlow を使用する方法を示すリソースについて紹介します。Gemini Enterprise Agent Platform の TensorFlow インテグレーションを使用すると、本番環境での TensorFlow モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。

ノートブックでコードを実行する

Agent Platform には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。これらのオプションの詳細については、ノートブックソリューションを選択するをご覧ください。

トレーニング用のビルド済みコンテナ

Gemini Enterprise Agent Platform には、モデルトレーニング用にビルド済みの Docker コンテナイメージが用意されています。これらのコンテナは ML フレームワークとフレームワークバージョン別に編成され、トレーニングコードで必要となる一般的な依存関係が含まれています。

ビルド済みのトレーニングコンテナを使用する TensorFlow バージョンと、ビルド済みのトレーニングコンテナでモデルをトレーニングする方法については、カスタムトレーニング用のビルド済みコンテナをご覧ください。

分散トレーニング

Gemini Enterprise Agent Platform では、TensorFlow モデルの分散トレーニングを実行できます。マルチワーカートレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Gemini Enterprise Agent Platform での分散トレーニングの詳細については、分散トレーニングをご覧ください。

推論用のビルド済みコンテナ

トレーニング用のビルド済みコンテナと同様に、Gemini Enterprise Agent Platform では、Gemini Enterprise Agent Platform 内外で作成した TensorFlow モデルから推論と説明をサービングするためのビルド済みコンテナイメージが用意されています。これらのイメージは、最小限の構成で推論を行うことができる HTTP 推論サーバーを提供します。

最適化された TensorFlow ランタイム

最適化された TensorFlow ランタイムは、モデルの最適化と新しい独自の Google テクノロジーにより、TensorFlow 用の Gemini Enterprise Agent Platform の標準のビルド済み推論コンテナよりも推論速度を向上させ、コストを削減します。

TensorFlow Cloud Profiler の統合

Gemini Enterprise Agent Platform の TensorFlow Cloud Profiler インテグレーションを使用してトレーニングジョブのパフォーマンスをモニタリングして最適化することで、コストを抑えながらモデルのトレーニングを迅速に行うことができます。TensorFlow Cloud Profiler を使用すると、トレーニングオペレーションのリソース消費量を把握し、パフォーマンスのボトルネックを特定して排除できます。

Agent Platform TensorFlow Cloud Profiler の詳細については、Profiler を使用してモデルのトレーニングパフォーマンスをプロファイリングするをご覧ください。

Gemini Enterprise Agent Platform で TensorFlow を使用するためのリソース

Gemini Enterprise Agent Platform での TensorFlow の詳細と使用方法については、次のリソースをご覧ください。

プロトタイプから本番環境へ: Gemini Enterprise Agent Platform でカスタム TensorFlow モデルを開発してデプロイするエンドツーエンドの例を示す動画シリーズ。
Gemini Enterprise Agent Platform で Reduction Server を使用してトレーニングパフォーマンスを最適化する: Reduction Server を使用して Gemini Enterprise Agent Platform の分散トレーニングを最適化する方法に関するブログ投稿。
Gemini Enterprise Agent Platform で TensorFlow Cloud Profiler を使用してトレーニングのパフォーマンスを最適化する方法: Gemini Enterprise Agent Platform TensorFlow Cloud Profiler を使用して、トレーニングジョブのパフォーマンスのボトルネックを特定する方法を説明するブログ投稿。
特徴フィルタリングを使用したカスタムモデルバッチ予測: Agent Platform SDK for Python を使用してカスタム表形式分類モデルをトレーニングし、特徴フィルタリングでバッチ推論を実行する方法を紹介するノートブックチュートリアル。
Agent Platform Pipelines: ビルド済みの Google Cloud パイプラインコンポーネントを使用したカスタムトレーニング: カスタムトレーニング用に、ビルド済みのパイプラインコンポーネントで Gemini Enterprise Agent Platform Pipelines を使用する方法を紹介するノートブックチュートリアル。 Google Cloud
予測用に同じ VM 上で TensorFlow モデルを共同ホストする: Gemini Enterprise Agent Platform で共同ホスティングモデル機能を使用して、オンライン推論のために同じ VM 上に複数のモデルをホストする方法を示す Codelab。