音声モデル

Dialogflow CX 音声エージェントは、音声認識に Dialogflow CX の料金に含まれている Speech-to-Text を使用します。 Dialogflow CX によって自動的に音声認識モデルが選択されますが、必要に応じてモデルを指定することもできます。

使用可能なモデル

使用可能なすべてのモデルは、 Speech-to-Text モデルに一覧表示されています。 ドメインに最適で、 エージェントの言語と音声機能をサポートするモデルを選択してください。

モデルが明示的に指定されていない場合、 Dialogflow CX は API リクエストとエージェント設定の音声構成に基づいて モデルを自動的に選択します。

通常、次のモデルが最適なパフォーマンスを発揮します。

モデルを指定する

モデル選択設定を使用して、エージェント、フロー、ページのモデルを指定できます。

Sessions.detectIntent メソッドまたは Sessions.streamingDetectIntent メソッドを呼び出すときにモデルを指定することもできます。

セッション リファレンスのプロトコルとバージョンを選択:

プロトコル V3 V3beta1
REST セッション リソース セッション リソース
RPC セッション インターフェース セッション インターフェース
C++ SessionsClient 利用できません
C# SessionsClient 利用できません
Go SessionsClient 利用できません
Java SessionsClient SessionsClient
Node.js SessionsClient SessionsClient
PHP 利用不可 利用できません
Python SessionsClient SessionsClient
Ruby 利用不可 利用できません
または、Agent AssistConversationProfile を構成する場合。リクエスト レベルの音声モデルをオーバーライドする 設定を有効にしない限り、インテント検出または会話プロファイル API 呼び出しでモデルを指定すると、エージェント、フロー、ページに適用されたモデルの選択がオーバーライドされます。