Looker の会話分析の概要

会話分析は、Gemini for Google Cloud を活用したデータとチャットする機能です。Looker のセマンティック モデリング レイヤを基盤とする会話分析により、組織内のユーザーは、ガバナンス対象の信頼できるセルフサービス BI を実現するために、データ関連の質問を標準の自然言語(会話型言語)で実行できます。このアプローチでは、エンタープライズ グレードのガバナンスとセキュリティを提供することで、組織全体での分析の導入を加速します。

会話分析は、Looker(Google Cloud コア)インスタンスと Looker(オリジナル)インスタンスの両方で利用できます。

Gemini for Google Cloud がデータを使用する方法とタイミングに関する説明をご覧ください。

主な機能

会話分析には次の主な機能があります。

  • Looker Explore と会話する: Looker(オリジナル)インスタンスまたは Looker(Google Cloud コア)インスタンス内の Looker Explore データまたはカスタム データ エージェントと自然言語で会話します。一度に最大 5 つの探索と会話できます。
  • データ エージェントの作成と管理: データ エージェントを使用すると、データに固有のコンテキストと指示を指定して、AI を活用したデータクエリ エージェントをカスタマイズできます。これにより、データ エージェントはより正確でコンテキストに関連性の高いレスポンスを生成できます。データ エージェントを他のユーザーと共有して、同じコンテキストで質問できるようにすることもできます。エージェントは最大 5 つの探索に接続できます。
  • コード インタープリタによる高度な分析 [プレビュー]: 会話分析内のコード インタープリタは、自然言語の質問を Python コードに変換し、そのコードを実行します。標準の SQL ベースのクエリと比較して、コード インタープリタで Python を使用すると、より複雑な分析と可視化が可能になります。
  • ウェブサイトまたはアプリケーションに Conversational Analytics を埋め込む: 他の Looker コンテンツ タイプと同様に、HTML iframe タグを使用して、ウェブサイトまたはアプリケーションに Conversational Analytics を埋め込むことができます。会話型分析では、ユーザーが Looker ログインを使用して認証されるプライベート埋め込みと、ユーザーが独自のアプリケーションを通じて認証される署名付き埋め込みの両方がサポートされています。

会話分析の仕組み

会話分析では、Gemini for Google Cloud を使用して自然言語の質問を解釈し、Looker のデータに基づいて回答を提供します。Looker セマンティック モデル(データの LookML 定義)を信頼できる唯一の情報源として使用し、回答の正確性と一貫性を確保します。会話型分析は、LookML で定義されている「収益」や「解約」などの指標のビジネス定義を解釈し、これらの定義を使用して正確で一貫性のある質問を返します。

会話分析では、回答を特定のデータとビジネス コンテキストに基づいて行うために、次のようないくつかの手法を使用します。

  • LookML スキーマ: リクエストの開始時に、会話分析は接続されている Explore からスキーマを取得します。会話分析では、LookML モデルのパラメータが次のように使用されます。
    • フィールドの識別: スキーマのメタデータにより、会話型分析で関連するフィールドを絞り込むことができます。このメタデータには、namelabeldescriptiontypedimension_group などの LookML パラメータが含まれます。これらのパラメータは、会話分析でユーザーの質問の用語を正しいフィールドにマッピングするのに役立ちます。たとえば、description は、フィールドのビジネス固有の用語やコンテキストを提供できます。
    • 回答の形式: 会話分析では、ユーザーにわかりやすいフィールド名に label パラメータを使用し、回答のデータの形式に value_format パラメータを使用します。
  • クエリの生成: 会話分析は、データベースを直接クエリするのではなく、クエリで使用するフィールド、フィルタ、並べ替え、上限を決定します。Looker は、基盤となる LookML モデルを使用してクエリを作成し、実行します。このプロセスは、ユーザーがデータ探索インターフェースを操作する方法と似ています。Looker は LookML モデルに基づいてクエリ構成を処理するため、会話型分析は複雑な結合ロジックやフィールド定義を理解する必要はありません。クエリ生成により、すべてのクエリが LookML モデルで定義された結合ロジック、フィルタリング、集計、データ権限に準拠します。クエリを生成するには、会話型分析でフィルタで使用する正しい値を特定する必要があります。これらの値は、基盤となるデータの値と完全に一致するか、ワイルドカードなどのより高度なフィルタ式である必要があります。ユーザーが自然言語の質問に含めた値と、フィルタで必要となる可能性のある正確な値との間の不一致を解決するために、Conversational Analytics は parameter フィールドの allowed_value で定義された値を使用し、ツールを使用してフィールド内の特定の値を確認できます。
    • サンプルデータ: 会話型分析がパターンを学習したり、フィルタ値の完全一致を見つけたりできるように、フィールドから最大 100 個の値を返します。
    • ファジー検索: ユーザー入力に基づいて一連の検索語句を生成し、ディメンションにそれらの語句が存在するかどうかを確認して、適切なフィルタ値を検索します。サンプルデータとファジー検索の両方で Looker の候補 API が使用されるため、suggestionssuggest_exploresuggest_dimension などの LookML パラメータの影響を受けます。
  • 分析: Looker がクエリを実行すると、会話型分析はクエリ結果を分析してユーザーの質問に回答します。会話分析では、次の 1 つ以上の方法で結果を分析できます。
    • 組み込みの Gemini 機能を使用して、結果を解釈して要約します。
    • コード インタープリタを介して Python コードを実行し、結果の詳細な分析を行います。
    • クエリ結果に基づいてビジュアリゼーションを作成します。

Looker セマンティック モデルを活用することで、会話型分析は、基盤となるデータの複雑さを理解することなく、BigQuery、AlloyDB、Redshift、Snowflake、Databricks などのさまざまなプラットフォームのデータにアクセスできます。また、すべてのレスポンスの一貫性とガバナンスを確保します。

会話分析データ エージェントの仕組み

会話分析データ エージェントは、Looker デベロッパーが定義したインスタンスの LookML スキーマと、エージェントの作成時に記述するエージェント指示という 2 つの主な入力に基づいてレスポンスを生成します。

クエリから、データ エージェントは、どの LookML フィールドを選択し、どのフィルタ、並べ替え、上限を適用するかを判断する必要があります。これを正確に行うため、クエリの自然言語を独自のエージェント手順とデータの LookML スキーマに次のようにマッピングします。

  1. セマンティック用語のマッピング: ユーザーは質問でビジネス用語をよく使用します。エージェントは、エージェントの指示と LookML フィールドのメタデータを使用してクエリを解釈します。たとえば、「新規ビジネスの成果はどのくらいですか?」というクエリに対して、データ エージェントは「新規ビジネス」を月次経常収益を計算する指標にマッピングできます。「主要なお客様は?」というクエリの場合、データ エージェントは「主要」を使用回数に、「お客様」を「顧客名」というディメンションにマッピングできます。
  2. フィールド値のマッピング: エージェントは、専用ツールを使用してデータをサンプリングしたり、ファジー検索を実行したりして、「カリフォルニア」や「スリムフィット ジーンズ」などの特定のデータポイントを探します。たとえば、ユーザーが「ジーンズ」をリクエストした場合、エージェントは [商品名] フィールドでファジー検索をトリガーし、データベースで完全一致する文字列を見つけることがあります。ユーザーが「NY」と入力した場合、それは [City](市区町村)フィールドですか、それとも [State](都道府県)フィールドですか?エージェントは、どのフィールドに「NY」が含まれているかを確認するために、データをサンプリングする必要がある場合があります。
  3. クエリの例による絞り込み: データ エージェントの指示で、一般的なクエリや重要なクエリの精度を高めるために、「ゴールデン クエリ」と呼ばれる具体的な質問と回答の例を指定できます。

Looker は、これらのフィールドの LookML 定義と、Explore で定義されている他のロジック(フィールド定義、アクセス権限付与ユーザー属性、複雑な Liquid ロジックや結合ロジックなど)を使用して、データベースに送信されるクエリを作成します。エージェントは SQL クエリ全体を記述しないため、データを「理解」する必要がなく、より正確かつ決定論的に動作できます。

データ エージェントと会話

データ エージェントを作成すると、単一の Explore との標準的な会話を行うよりも、次のようなメリットがあります。Explore から会話を開始すると、特定のデータソースの自然言語クエリをすばやく実行できますが、データ エージェントは、組織全体でカスタマイズして共有できる、専門のスタンドアロン アナリストとして機能します。

データ エージェントには、データ探索との会話に比べて次のような利点があります。

  • 複数の Explore とのチャット: Explore との会話では、一度に 1 つの Explore に対してのみクエリを実行できます。ただし、データ エージェントは最大 5 つの異なる Explore に接続できるため、ユーザーはクロスドメイン分析を実行して、より包括的な回答を得ることができます。
  • 作成済みコンテキスト: 標準の Explore 会話では使用できないカスタム手順をデータ エージェントに提供できます。これには、次のリソースが含まれます。
    • ゴールデン クエリ: 自然言語の質問と検証済みの Looker クエリのペアをエージェントに提供して、一般的なビジネス パターンを固定し、モデルの曖昧さを大幅に軽減できます。
    • ビジネス用語集: エージェントの指示内で、組織固有の専門用語や頭字語を直接定義できます。
    • ペルソナ フレームワーク: エージェントに特定の役割や専門知識を割り当て、会話の一貫したトーンと専門的な判断を設定できます。
  • エージェントの専門化: 会話の単一の汎用インターフェースを使用するのではなく、収益エージェントや運用エージェントなど、さまざまなビジネス ユニットの専門エージェントを作成できます。これにより、分析をより効率的に進めることができ、ユーザーはニーズに最も関連性の高い特定のフィールドやフィルタにたどり着くことができます。
  • コラボレーションと再利用: Explore の会話は通常 1 人のユーザーに限定されますが、データ エージェントは組織の他のメンバーと共有できます。共有により、複数のユーザーが、管理者またはデータ エキスパートが作成した同じコンテキストとガバナンスを利用できます。
  • カスタム動作: デフォルトのフィルタ(「期間が指定されていない場合は常に過去 6 か月をデフォルトにする」など)を使用するなど、厳格な要件内で動作するようにエージェントを構成できます。これらのガードレールにより、エージェントが組織固有のガバナンスとセキュリティの標準内で動作することが保証されます。Explore でフィールドを非表示にして、データ エージェントがクエリでフィールドを使用できないようにすることもできます。

ドキュメントのリスト

Gemini in Looker 機能のコンプライアンス機能を理解する

会話型分析は、FedRAMP High または FedRAMP Medium の認証境界にまだ含まれていません。Looker インスタンスで Gemini in Looker 設定を有効にする前に、Gemini for Google Cloudのコンプライアンス サービスが組織のニーズを満たしているかどうかについて、承認機関と話し合ってください。

Looker(Google Cloud コア)インスタンスの場合、利用可能になる各 Assured Workloads コントロール パッケージは、そのパッケージの変更要件とプロセスが満たされると、Gemini in Looker 機能をデフォルトのサービスとして追加します。Looker の会話型分析は、関連付けられた Looker(Google Cloud コア)インスタンスのコンプライアンス機能を尊重します。ただし、次の例外があります。

データ所在地(DRZ)のサポート(特に保存データ)は、すべての Looker のお客様が利用できます。会話分析に関連付けられているすべての保存データは、Looker インスタンス内に厳密に存在し、単一のリージョンに限定されます。転送中のデータは、グローバル サービスを使用して処理されることがあります。

フィードバックを送信

会話分析の個々の回答について Google にフィードバックを提供するには、次のいずれかのオプションを選択します。

  • thumb_up Good response(良い回答): 回答が役に立ったことを示します。
  • thumb_down Bad response(悪い回答): 回答が役に立たなかったことを示します。