音声モデル

Dialogflow CX 音声エージェントは、音声認識に Dialogflow CX の料金に含まれている Speech-to-Text を使用します。 Dialogflow CX によって自動的に音声認識モデルが選択されますが、必要に応じてモデルを指定することもできます。

使用可能なモデル

使用可能なすべてのモデルは、 Speech-to-Text モデルに一覧表示されています。 ドメインに最適で、 エージェントの言語と音声機能をサポートするモデルを選択してください。

モデルが明示的に指定されていない場合、 Dialogflow CX は API リクエストとエージェント設定の音声構成に基づいて モデルを自動的に選択します。

エージェントで 拡張音声モデル が有効になっていて、その言語の指定モデルに拡張バージョンが存在しない場合、 指定されたモデルの標準版を使用して音声が認識されます。

通常、次のモデルが最も優れたパフォーマンスを発揮します。

  • telephony_short(テレフォニー Dialogflow CX に最適)
  • telephony(Agent Assist に最適)
  • phone_call(Agent Assist とテレフォニー Dialogflow CX に推奨)
  • latest_short(テレフォニー以外の Dialogflow CX に最適)
  • command_and_search(他のモデルが使用できない言語に最適)

モデルを指定する

Sessions タイプの detectIntent メソッドまたは streamingDetectIntent メソッドを呼び出すとき、または Agent AssistConversationProfile を構成するときにモデルを指定できます。