Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Agent Platform での推論取得の概要

推論とは、トレーニング済み ML モデルの出力です。このページでは、Gemini Enterprise Agent Platform のモデルから推論を取得するワークフローの概要について説明します。

Agent Platform では、次の 2 つの方法で推論を取得できます。

オンライン推論は、 Endpointにデプロイされたモデルに対して行われる同期リクエストです。したがって、リクエストを送信する前に、まず Model リソースをエンドポイントにデプロイする必要があります。これにより、コンピューティングリソースがモデルに関連付けられ、モデルが低レイテンシでオンライン推論を行えるようになります。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン推論を使用します。
バッチ推論は、エンドポイントにデプロイされていないモデルに対して行われる非同期リクエストです。リクエストを（BatchPredictionJob リソースとして）Model リソースに直接送信します。即時のレスポンスが必要なく、累積されたデータを 1 回のリクエストで処理する場合は、バッチ推論を使用します。

ローカルでモデルをテストする

推論を取得する前に、開発およびテストフェーズ中にモデルをローカルエンドポイントにデプロイすると便利です。これにより、オンラインエンドポイントにデプロイすることや推論費用を発生させることなく、イテレーションを迅速に行い、モデルをテストできます。ローカルへのデプロイは、ローカルでの開発とテストを目的としており、本番環境へのデプロイを目的とするものではありません。

モデルをローカルにデプロイするには、Agent Platform SDK for Python を使用して、 LocalModel を LocalEndpointにデプロイします。デモについては、こちらのノートブックをご覧ください。

クライアントが Python で作成されていない場合でも、Agent Platform SDK for Python を使用してコンテナとサーバーを起動し、クライアントからのリクエストをテストできます。

カスタムトレーニング済みモデルから推論を取得する

推論を取得するには、まずモデルをインポートする必要があります。インポートしたモデルは Model リソースとなり、 Model Registry に表示されます。

その後、推論を取得する方法について、次のドキュメントをご覧ください。

バッチ推論を取得する。

または
モデルをエンドポイントにデプロイし、オンライン推論を取得する。

AutoML モデルから推論を取得する

カスタムトレーニングモデルとは異なり、AutoML モデルはトレーニング後に Model Registry に自動的にインポートされます。

それ以外は AutoML モデルのワークフローも似ていますが、データ型とモデルの目標によって若干異なります。AutoML 推論の取得に関するドキュメントは、その他の AutoML のドキュメントとともに用意されています。次のセクションでは、ドキュメントへのリンクを示します。

画像

次のタイプの画像 AutoML モデルから推論を取得する方法を確認します。

表形式

次のタイプの表形式 AutoML モデルから推論を取得する方法を確認します。

表形式の分類モデルと回帰モデル
- オンライン推論
- バッチ推論
表形式の予測モデル（バッチ推論のみ）

BigQuery ML モデルから推論を取得する

BigQuery ML モデルから推論を取得する方法は 2 つあります。

BigQuery ML のモデルから直接バッチ推論をリクエストする。
モデルを BigQuery ML からエクスポート、あるいは Model Registry にインポートせず、Model Registry に直接登録する。

次のステップ

推論用のコンピューティングリソースについて確認する。

Agent Platform での推論取得の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。