Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

音声モデル

Dialogflow CX 音声エージェントは、音声認識に Dialogflow CX の料金に含まれている Speech-to-Text を使用します。Dialogflow CX によって自動的に音声認識モデルが選択されますが、必要に応じてモデルを指定することもできます。

使用可能なモデル

使用可能なすべてのモデルは、Speech-to-Text モデルに記載されています。ドメインに最適で、エージェントの言語と音声機能をサポートしているモデルを選択します。

モデルが明示的に指定されていない場合、Dialogflow CX は API リクエストとエージェント設定の音声構成に基づいてモデルを自動的に選択します。

エージェントで拡張音声モデルが有効になっていて、その言語の指定モデルに拡張バージョンが存在しない場合、指定されたモデルの標準バージョンを使用して音声が認識されます。

通常、次のモデルのパフォーマンスが最も優れています。

Sessions タイプの detectIntent メソッドまたは streamingDetectIntent メソッドを呼び出すとき、または Agent Assist の ConversationProfile を構成するときにモデルを指定できます。