API を使用して音声ファイルと文字起こしファイルをメタデータとともにインポートする方法について説明します。UploadConversation API を使用して 1 つのファイルをインポートすることも、IngestConversations API を使用して Cloud Storage バケットからすべてのファイルを一括でインポートすることもできます。
2 つのリクエスト コマンド UploadConversation と IngestConversations は、次の関数をサポートしています。
| リクエスト コマンド | ファイル数 | Speech-to-Text | 秘匿化 | メタデータの取り込み | 自動分析 |
|---|---|---|---|---|---|
| UploadConversation | 1 | ✔ | ✔ | ✔ | プロジェクトの [設定](/contact-center/insights/docs/reference/rest/v1alpha1/Settings#analysisconfig)で分析ルールまたは会話分析のアップロードの割合を指定する |
| IngestConversations | バケット内のすべてのファイル | ✔ | ✔ | ✔ | 分析ルールのみ |
前提条件
- Dialogflow で使用する Google Cloud プロジェクトで、Cloud Storage、Speech-to-Text、Cloud Data Loss Prevention、Customer Experience Insights の各 API を有効にします。
- 会話データ(デュアルチャネル音声ファイルと文字起こしファイル)を、標準ストレージ クラスを使用して Cloud Storage のバケットに保存します。
- Cloud ストレージ クイックスタートの手順に沿って、バケットを作成します。
- バケットのロケーションを現在地に最も近い場所に設定します。
- 会話データを提供するときに必要な情報は次のとおりです。
- バケット名
- ロケーション ID、形式:
us-west1 - オブジェクト パス、形式:
gs://<bucket>/<object>
- Speech-to-Text と Customer Experience Insights のサービス エージェントに、Cloud Storage バケット内のオブジェクトへのアクセス権を付与します。サービス アカウントについては、こちらのトラブルシューティング ページをご覧ください。
会話メタデータのインポートを選択した場合は、メタデータ ファイルが独自のバケットにあり、メタデータ ファイル名が対応する会話ファイル名と一致していることを確認してください。
たとえば、Cloud Storage URI
gs://transcript-bucket-name/conversation.mp3を含む会話には、対応するメタデータ ファイル(gs://metadata-bucket-name/conversation.jsonなど)が必要です。
会話データ
会話データは、音声またはチャットの文字起こしと音声で構成されます。
成績証明
チャットの文字起こしは JSON 形式のファイルで指定する必要があります。各ファイルには 1 つの会話のデータが含まれています。JSON 形式のテキスト ファイルには、会話データの形式が含まれています。
音声文字起こしは、会話データ形式で提供することも、Speech-to-Text API の文字起こしで返される音声認識結果として提供することもできます。レスポンスは、すべての Speech-to-Text API バージョンで同期認識と非同期認識で同じです。
音声
Customer Experience Insights は、Cloud Speech-to-Text のバッチ認識を使用して音声を文字に変換します。CX インサイトは、認識ツール リソースを使用して Speech-to-Text の文字起こし設定を構成します。リクエストでカスタム認識ツールを作成できます。また、[設定] またはリクエストで認識ツールを指定しない場合、CX Insights はプロジェクトにデフォルトの ccai-insights-recognizer を作成します。
CX Insights 認識ツールは、テレフォニー モデルを使用して英語の音声を文字起こしします。デフォルトの言語は en-US です。地域、言語、モデル、認識機能ごとの Speech-to-Text のサポートの一覧については、Speech-to-Text の言語サポートに関するドキュメントをご覧ください。
CX Insights に音声を初めてインポートする前に、次のいずれを行うか検討してください。
- カスタムの Speech-to-Text 文字起こし構成を使用します。
- (必要に応じて)編集された会話を分析します。
これらのアクションは、プロジェクトの 設定リソースで適切なフィールドを設定することで、各 UploadConversation リクエストまたは IngestConversation リクエストでデフォルトで実行するように構成できます。音声と秘匿化の設定は、リクエストごとにオーバーライドすることもできます。音声設定を指定しない場合、CX Insights はデフォルトの音声設定を使用し、文字起こしを編集しません。
秘匿化
Cloud Data Loss Prevention は、プロジェクトの [設定]、UploadConversationRequest、または IngestConversationsRequest で明示的に秘匿化構成を指定しない限り、文字起こしを秘匿化しません。Cloud Data Loss Prevention は、秘匿化用の検査テンプレートと匿名化テンプレートの両方をサポートしています。
プロジェクトの構成
UploadConversation リクエストと IngestConversations リクエストの墨消しと音声は、対応するプロジェクト設定パラメータを設定することで構成できます。これらの構成は、リクエストごとに個別に設定することもできます。この場合、プロジェクト設定がオーバーライドされます。分析ルールで構成された analysis_percentage は、プロジェクトの設定で構成された upload_conversation_analysis_percentage をオーバーライドします。
リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://contactcenterinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/settings?updateMask=redaction_config,speech_config,analysis_config.upload_conversation_analysis_percentage"
メタデータ
メタデータを単一ファイルとしてインポートするか、一括インポートとしてインポートします。
リクエストにメタデータを直接含める
単一ファイルのインポートの場合のみ、品質メタデータを UploadConversationsRequest の curl コマンドに直接含めることができます。
curl --request POST \ 'https://contactcenterinsights.googleapis.com/v1/projects/project-id/locations/location-id/conversations:upload' \ --header 'Authorization: Bearer [YOUR_ACCESS_TOKEN]' \ --header 'Accept: application/json' \ --header 'Content-Type: application/json' \ --data '{ "conversation":{ "qualityMetadata":{ "agentInfo":[{"agentId":"agent-id","displayName":"agent-name"}] }, "dataSource":{"gcsSource":{"transcriptUri":"transcript-uri"}}} }'
Cloud Storage ファイルからメタデータをインポートする
会話メタデータ ファイルは JSON 形式のファイルとして指定します。一括インポートの場合は、IngestConversationsRequest の gcs_source.metadata_bucket_uri フィールドで指定されたバケットを指定します。単一のインポートの場合は、UploadConversationRequest の data_source.metadata_uri フィールドにオブジェクト パスを指定します。
CX Insights は、ファイル内の会話品質メタデータを入力しますが、カスタム メタデータを作成することもできます。
たとえば、データセット内の各会話にカスタム会話 ID を指定するには、Cloud Storage 内の会話オブジェクトにカスタム メタデータを指定します。キーを ccai_insights_conversation_id に設定します。値はカスタム会話 ID です。カスタムの会話 ID は、メタデータ ファイル内で指定することもできます。
IngestConversationsRequest の custom_metadata_keys フィールドにカスタム メタデータを指定すると、CX Insights はそのカスタム メタデータを会話のラベルに保存します。最大 100 個のラベルをサポートします。
Conversation.quality_metadata リソース、カスタム会話 ID、会話の開始時間を含む有効なメタデータ ファイルの例を次に示します。
{
"customer_satisfaction_rating": 5,
"agent_info": [
{
"agent_id": "123456",
"display_name": "Agent Name",
"team": "Agent Team",
"disposition_code": "resolved"
}
],
"custom_key": "custom value"
"conversation_id": "custom-conversation-id"
"start_time": "%Y-%m-%d%ET%H:%M:%E*S%Ez"
}
単一の音声ファイルをインポートする
UploadConversation API は、会話の文字起こしと、必要に応じて会話の秘匿を行う長時間実行オペレーションを作成します。会話の DataSource に audio_uri のみが含まれている場合、音声ファイルは文字起こしされます。それ以外の場合は、指定された transcript_uri が読み取られて使用されます。
リクエストの本文(JSON):
{
"conversation": {
"data_source": {
"gcs_source": { "audio_uri": AUDIO_URI }
}
},
"redaction_config": {
"deidentify_template": DEIDENTIFY_TEMPLATE,
"inspect_template": INSPECT_TEMPLATE
},
"speech_config": {
"speech_recognizer": RECOGNIZER_NAME
}
}
リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://contactcenterinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/conversations:upload"
一括インポート
REST
詳細については、conversations:ingest API エンドポイントをご覧ください。
リクエストのデータを使用する前に、次のように置き換えます。
- PROJECT_ID: Google Cloud Platform プロジェクト ID。
- GCS_BUCKET_URI: 会話の文字起こしを含むバケットを指す Cloud Storage URI。接頭辞を含む場合があります。たとえば、gs://BUCKET_NAME や gs://BUCKET_NAME/PREFIX です。ワイルドカードはサポートされていません。
- MEDIUM: データ型に応じて
PHONE_CALLまたはCHATに設定します。指定しない場合、デフォルト値はPHONE_CALLです。 - AGENT_ID: 省略可。バケット全体のエージェント ID。
HTTP メソッドと URL:
POST https://contactcenterinsights.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/conversations:ingest
リクエストの本文(JSON):
{
"gcsSource": {
"bucketUri": "GCS_BUCKET_URI",
"bucketObjectType": "AUDIO"
},
"transcriptObjectConfig": { "medium": "PHONE_CALL" },
"conversationConfig": {
"agentId": "AGENT_ID",
"agentChannel": "AGENT_CHANNEL",
"customerChannel": "CUSTOMER_CHANNEL"
}
}
Or
{
"gcsSource": {
"bucketUri": "GCS_BUCKET_URI",
"bucketObjectType": "TRANSCRIPT"
},
"transcriptObjectConfig": { "medium": "MEDIUM" },
"conversationConfig": {"agentId": "AGENT_ID"}
}
リクエストを送信するには、次のいずれかのオプションを展開します。
次のような JSON レスポンスが返されます。
{
"name": "projects/PROJECT_ID/locations/us-central1/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.contactcenterinsights.v1main.IngestConversationsMetadata",
"createTime": "...",
"request": {
"parent": "projects/PROJECT_ID/locations/us-central1",
"gcsSource": {
"bucketUri": "GCS_BUCKET_URI",
"bucketObjectType": "BUCKET_OBJECT_TYPE"
},
"transcriptObjectConfig": {
"medium": "MEDIUM"
},
"conversationConfig": {
"agentId": "AGENT_ID"
}
}
}
}
オペレーションをポーリングする
UploadConversation リクエストと IngestConversation リクエストの両方で、長時間実行オペレーションが返されます。長時間実行メソッドは非同期で、メソッドがレスポンスを返すときにオペレーションがまだ完了していない場合があります。オペレーションをポーリングして、そのステータスを確認できます。詳細とコードサンプルについては、長時間実行オペレーションのページをご覧ください。
Speech-to-Text の割り当て
Customer Experience Insights では、BatchRecognize と GetOperation の 2 つの異なる Speech-to-Text API が使用されます。Customer Experience Insights は、Speech-to-Text の文字起こしを開始する BatchRecognize リクエストと、文字起こしが完了したかどうかをモニタリングする GetOperation リクエストを行います。BatchRecognize オペレーションを開始するには、1 分あたり、リージョンごとの割り当てを使用する BatchRecognize リクエストが行われます。オペレーションをモニタリングするために、1 分あたり、リージョンごとの割り当てを使用する GetOperation リクエストが発行されます。
1 回の UploadConversation 呼び出しで、Customer Experience Insights は 1 つの BatchRecognize を消費しますが、タスクの所要時間によっては、より多くの GetOperation リクエストを消費する可能性があります。一括インポートの場合、Customer Experience Insights は各タイプのリクエストを 100 件消費します。