一部のサービスと機能は名前を変更中です。生成ハンドブックとフロー機能も、単一の統合コンソールに移行されます。詳しくは、こちらをご覧ください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

サービス使用のベストプラクティス

このガイドでは、Dialogflow サービスの使用に関するベストプラクティスについて説明します。ここで示すガイドラインの目的は、効率と精度を向上させることと、サービスからのレスポンス時間を最適化することです。

すべてのエージェントタイプについての一般的なエージェントの設計のガイドと、音声エージェントの設計に特化した音声エージェントの設計のガイドもご覧ください。

プロダクション

エージェントを本番環境で実行する場合は、必ずプロダクションのベストプラクティスを実施してください。

エージェントバージョンを使用する
セッションクライアントを再利用する
再試行によるエラー処理を実装する

監査ログを有効にする

プロジェクトで Dialogflow API のデータアクセス監査ログを有効にします。変更履歴機能と同様に、監査ログを使用すると、プロジェクトに関連付けられた Dialogflow CX エージェントの設計時の変更を追跡できます。

エージェントバージョン

本番環境のトラフィックには、必ずエージェントのバージョンを使用してください。詳細については、バージョンと環境をご覧ください。

エージェントのバックアップを作成する

最新のエクスポートされたエージェントバックアップを維持します。これにより、ご自身またはチームメンバーがエージェントやプロジェクトを誤って削除した場合に迅速に復旧できます。

クライアントを再利用する

アプリケーションの実行の全期間中にわたって、*Client クライアントライブラリインスタンスを再利用することで、アプリケーションのパフォーマンスを向上させることができます。

最も重要な点は、SessionsClient クライアントライブラリインスタンスを再利用することで、インテント検出 API 呼び出しのパフォーマンスを向上させることができることです。

セッションリファレンスのプロトコルとバージョンを選択:

プロトコル	V3	V3beta1
REST	セッションリソース	セッションリソース
RPC	セッションインターフェース	セッションインターフェース
C++	SessionsClient	利用できません
C#	SessionsClient	利用できません
Go	SessionsClient	利用できません
Java	SessionsClient	SessionsClient
Node.js	SessionsClient	SessionsClient
PHP	利用不可	利用できません
Python	SessionsClient	SessionsClient
Ruby	利用不可	利用できません

詳細については、クライアントライブラリのベストプラクティスのガイドをご覧ください。

API エラー再試行

API メソッドを呼び出すときに、エラーレスポンスが返されます。エラー原因が一時的な問題のため、再試行が必要なエラーがもあります。エラーには次の 2 つの種類があります。

Cloud API のエラー
Webhook ステータスから送信されたエラー。

また、再試行には指数バックオフを実装する必要があります。これにより、API サービスの負荷が大きい場合に、システムが許容レートを検出できます。

Cloud API のエラー

Google が提供するクライアントライブラリを使用している場合は、指数バックオフを使用した Cloud API エラーの再試行が実装されます。

REST または gRPC を使用して独自のクライアントライブラリを実装した場合は、クライアントの再試行を自分で実装する必要があります。再試行する必要があるエラーと必要ないエラーについては、API 改善の提案: 自動再試行の構成をご覧ください。

Webhook エラー

API 呼び出しによって Webhook 呼び出しがトリガーされると、Webhook がエラーを返す場合があります。Google が提供するクライアントライブラリを使用している場合でも、Webhook エラーは自動的に再試行されません。コードは、Webhook から受信した 503 Service Unavailable エラーを再試行する必要があります。 Webhook エラーの種類とそれらの確認方法については、Webhook サービスのドキュメントをご覧ください。

負荷テスト

コードを本番環境にリリースする前に、システムの負荷テストを実施することをおすすめします。負荷テストを実装する前に、次の点を考慮してください。

概要	詳細
段階的な負荷の増加。	負荷テストでは、Dialogflow サービスに適用される負荷を段階的に増大する必要があります。このサービスは、実際のトラフィックではまれにのみ発生する負荷の急増を処理するようには設計されていません。サービスが負荷の需要に合わせて調整を行うのに時間を要するため、テストが目的の負荷に達するまでリクエストレートを徐々に上昇させます。
API 呼び出しの課金。	テスト中の API 呼び出しは課金の対象であり、プロジェクトの割り当てによる制限を受けます。
テストダブルの使用。	負荷テスト中に API を呼び出す必要はありません。負荷テストの目的が、システムの負荷の処理方法を決定することの場合、実際の API 呼び出しの代わりにテストダブルを使用することをおすすめします。テストダブルを使用すると、読み込み中の API の動作をシミュレートできます。
再試行の実施。	負荷テストでは、バックオフを使用して再試行を行う必要があります。

エンドユーザーデバイスから Dialogflow を安全に呼び出す

Dialogflow API へのアクセスに使用する秘密鍵をエンドユーザーデバイスに保存しないでください。これは、鍵をデバイスに直接保存する場合と、アプリケーションでハードコーディングする場合について該当します。クライアントアプリケーションで Dialogflow API を呼び出す必要がある場合は、安全なプラットフォーム上のデベロッパー所有のプロキシサービスにリクエストを送信する必要があります。プロキシサービスでは、実際の認証済み Dialogflow 呼び出しを行うことができます。

たとえば、Dialogflow を直接呼び出すモバイルアプリは作成しないでください。そのようなアプリケーションを作成すると、秘密鍵をエンドユーザーのデバイスに保存する必要があります。その代わりに、モバイルアプリは安全なプロキシサービスを介してリクエストを渡す必要があります。

注: Dialogflow Messenger などの一部の Dialogflow 統合では、上記の記述と同様に、クライアントコードとプロキシサービスの両方が提供されます。プロキシサービスは、統合が有効になっている場合にのみリクエストに応答します。これらの統合の利便性を高めるため、プロキシサービスでは認証が不要になる場合があります。プロキシサービス API は、統合に必要な Dialogflow API メソッドの小さなサブセットに限定されています。さらに、プロキシサービスでは、認証を必要とせずに Google Cloud または Dialogflow の管理 API へのアクセス権が付与されることはありません。この制限付きプロキシ API により、不正使用による脆弱性が軽減されます。

パフォーマンス

このセクションでは、Dialogflow 内のさまざまなオペレーションのパフォーマンスについて説明します。これらの値は Dialogflow SLA の一部ではありませんが、レスポンシブなエージェントを設計し、現実的なパフォーマンスの期待値を設定するには、レイテンシを理解することが重要です。

モニタリングツールとアラートツールの構築では、大規模言語モデル（LLM）と音声処理は通常、ストリーミング方式で処理されることに注意してください。レスポンスはできるだけ早くクライアントに送信されます。多くの場合、メソッド呼び出しの合計時間よりもはるかに早く送信されます。詳細については、大規模言語モデル（LLM）のベストプラクティスをご覧ください。

オペレーションごとのパフォーマンス

次の表に、Dialogflow オペレーションの一般的なパフォーマンスを示します。

アクション	メモ
フローのアクション: 状態ハンドラ	最も速いオペレーション
フロー: インテント検出（テキスト）	最も速いオペレーション
フロー: パラメータ検出（テキスト）	高速オペレーション
音声認識（ストリーミング）	データが処理され、レスポンスが可能な限り早く返されます。合計実行時間は、主に入力音声の長さによって決まります。合計実行時間を使用してレイテンシを測定することをおすすめしません。
音声合成（ストリーミング）	合計実行時間は、主に音声出力の長さによって決まります。データが処理され、レスポンスが可能な限り早く返されます。
データストア: 生成 AI が無効	実際の時間はデータストアのサイズによって異なります。
データストア: 生成 AI が有効	パフォーマンスは、データストアのサイズ、使用中の言語モデル、プロンプトの出力と入力の長さによって異なります。
生成的フォールバック	パフォーマンスは、使用する言語とプロンプトの出力と入力の長さによって異なります。
生成ツール	パフォーマンスは、使用中の言語モデル、プロンプトの入力と出力の長さの複雑さ、ターンの生成ツールの数によって異なります。1 つのターンに複数の生成ツールがあると、言語モデルへの呼び出しが複数回行われます。
ハンドブックの実行	パフォーマンスは、ハンドブックの複雑さ、プロンプトの数、呼び出されたツールの実行時間によって異なります。プロンプトの出力と入力の長さは、このパフォーマンスに影響します。複数の言語モデルプロンプトが順番に実行され、合計呼び出し時間が長くなることがあります。
ハンドブック: ツール	パフォーマンスは、ツールの基盤となる実行によって異なります。
Webhook の呼び出し	パフォーマンスは、Webhook でのコードの実行時間によって直接決まります。
エージェントのインポート / エクスポート	パフォーマンスはエージェントのサイズによって異なります。
エージェントトレーニング	パフォーマンスは、フロー、インテント、トレーニングフレーズの数によって異なります。大規模なエージェントのトレーニングには数十分かかることがあります。
環境の作成	環境の作成にはエージェントのトレーニングが含まれるため、合計時間はエージェントのサイズと複雑さによって異なります。

重要な注意事項:

ストリーミング: ストリーミング呼び出し（音声認識と合成）の場合、データは到着時に処理され、レスポンスは可能な限り早く返されます。つまり、最初のレスポンスは通常、呼び出しの合計時間よりもはるかに速くなります。
ハンドブック: LLM プロンプトは、ハンドブックの指示、会話のコンテキスト、ツールの入力に基づいて作成されます。1 回のハンドブック呼び出しで複数の LLM プロンプトを実行できます。そのため、ハンドブックの実行は、発行されるプロンプトの数と呼び出しの複雑さによって異なります。

レイテンシに関する重要な考慮事項

レイテンシの保証なし: Dialogflow SLA では、プロビジョンドスループットでもレイテンシは考慮されません。
LLM のレイテンシ: LLM 処理では、レイテンシが大幅に発生する可能性があります。エージェントの設計とユーザーの期待値にこれを考慮してください。
モニタリングとアラート: モニタリングとアラートを設定する場合は、LLM と音声サービスからのレスポンスのストリーミング特性を考慮してください。完全なレスポンス時間が最初のレスポンス時間と同じであると想定しないでください。

コンパニオンの呼び出し

一般的なエージェント設計のベストプラクティス

サービス使用のベスト プラクティス コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。