Python SDK を使用してデータエージェントを構築する

このページでは、Python SDK を使用して Conversational Analytics API にリクエストを送信する方法について説明します。Python コードサンプルは、次のタスクを行う方法を示しています。

環境の認証と設定を行う
課金プロジェクトとシステム指示を指定する
Looker、BigQuery、Looker Studio のデータソースに接続する
ステートフルまたはステートレスチャットのコンテキストを設定する
データエージェントを作成する
会話を作成する
データエージェントと会話を管理する
API を使用して質問する
ステートレスマルチターンの会話を作成する
ヘルパー関数を定義する

環境の認証と設定を行う

会話分析 API 用の Python SDK を使用するには、会話分析 API SDK Colaboratory ノートブックの手順に沿って SDK をダウンロードしてインストールします。なお、ダウンロード方法と SDK Colab の内容は変更される可能性があります。

ノートブックの設定手順を完了したら、次のコードを使用して、必要な SDK ライブラリのインポート、Colaboratory 環境内での Google アカウントの認証を行い、API リクエストを行うクライアントを初期化できます。

from google.colab import auth
auth.authenticate_user()

from google.cloud import geminidataanalytics

data_agent_client = geminidataanalytics.DataAgentServiceClient()
data_chat_client = geminidataanalytics.DataChatServiceClient()

課金プロジェクトとシステム指示を指定する

次の Python サンプルコードは、スクリプト全体で使用される課金プロジェクトとシステム指示を定義します。

# Billing project
billing_project = "my_project_name"

# System instructions
system_instruction = "Help the user analyze their data."

サンプル値を次のように置き換えます。

my_project_name: 必要な API が有効になっている課金プロジェクトの ID。
Help the user analyze their data.: エージェントの動作をガイドし、データのニーズに合わせてカスタマイズするためのシステム指示。たとえば、システム指示を使用してビジネス用語を定義したり、回答の長さを制御したり、データの形式を設定できます。理想的には、効果的なシステム指示を記述するで推奨されている YAML 形式でシステム指示を定義し、構造化された詳細なガイダンスを提供します。

データソースに接続する

以降のセクションでは、エージェントのデータソースの接続の詳細を定義する方法について説明します。エージェントは、Looker、BigQuery、Looker Studio のデータに接続できます。

Looker データに接続する

次のコード例は、API キーまたはアクセストークンを使用して Looker Explore への接続の詳細を定義する方法を示しています。 Conversational Analytics API を使用すると、一度に最大 5 つの Looker Explore に接続できます。

Looker データソースに接続する場合は、次の点に注意してください。

会話で、含まれている Explore をクエリできます。
エージェントが一度にクエリできる Explore は 1 つのみです。複数のデータ探索にまたがって同時にクエリを実行することはできません。
エージェントは、同じ会話で複数の探索に対してクエリを実行できます。
エージェントは、複数の部分から構成される質問を含む会話や、フォローアップの質問を含む会話で、複数の探索をクエリできます。

たとえば、ユーザーが 2 つの Explore（cat-explore と dog-explore）を接続します。ユーザーが「猫の数と犬の数ではどちらが多いですか？」という質問を入力します。これにより、cat-explore の猫の数をカウントするクエリと、dog-explore の犬の数をカウントするクエリの 2 つが作成されます。エージェントは、両方のクエリを完了した後、両方のクエリの数値を比較します。

API キー

会話分析 API を使用してデータソースの認証と接続を行うで説明されているように、生成された Looker API キーを使用して Looker インスタンスとの接続を確立できます。

looker_client_id = "my_looker_client_id"
looker_client_secret = "my_looker_client_secret"
looker_instance_uri = "https://my_company.looker.com"
lookml_model_1 = "my_model"
explore_1 = "my_explore"
lookml_model_2 = "my_model_2"
explore_2 = "my_explore_2"

looker_explore_reference = geminidataanalytics.LookerExploreReference()
looker_explore_reference.looker_instance_uri = looker_instance_uri
looker_explore_reference.lookml_model = "my_model"
looker_explore_reference.explore = "my_explore"

looker_explore_reference2 = geminidataanalytics.LookerExploreReference()
looker_explore_reference2.looker_instance_uri = looker_instance_uri
looker_explore_reference2.lookml_model = "my_model_2"
looker_explore_reference2.explore = "my_explore_2"

credentials = geminidataanalytics.Credentials()
credentials.oauth.secret.client_id = looker_client_id
credentials.oauth.secret.client_secret = looker_client_secret

datasource_references = geminidataanalytics.DatasourceReferences()
datasource_references.looker.explore_references = [looker_explore_reference, looker_explore_reference2]

# Do not include the following line during agent creation
datasource_references.credentials = credentials

サンプル値を次のように置き換えます。

my_looker_client_id: 生成された Looker API キーのクライアント ID。
my_looker_client_secret: 生成された Looker API キーのクライアントシークレット。
https://my_company.looker.com: Looker インスタンスの完全な URL。
my_model: 接続する Explore を含む LookML モデルの名前。
my_explore: データエージェントがクエリを実行する Looker Explore の名前。
my_model_2: 接続する Explore を含む 2 番目の LookML モデルの名前。この変数は、最大 5 つの Explore の追加モデルに対して繰り返すことができます。
my_explore_2: データエージェントがクエリを実行する追加の Looker Explore の名前。この変数を繰り返して、最大 5 つの探索を含めることができます。

アクセストークン

会話分析 API を使用してデータソースの認証と接続を行うで説明されているように、アクセストークンを使用して Looker インスタンスとの接続を確立できます。

looker_access_token = "my_access_token"
looker_instance_uri = "https://my_company.looker.com"
lookml_model = "my_model"
explore = "my_explore"
lookml_model_2 = "my_model_2"
explore_2 = "my_explore_2"

looker_explore_reference = geminidataanalytics.LookerExploreReference()
looker_explore_reference.looker_instance_uri = looker_instance_uri
looker_explore_reference.lookml_model = "my_model"
looker_explore_reference.explore = "my_explore"

looker_explore_reference2 = geminidataanalytics.LookerExploreReference()
looker_explore_reference2.looker_instance_uri = looker_instance_uri
looker_explore_reference2.lookml_model = "my_model_2"
looker_explore_reference2.explore = "my_explore_2"

credentials = geminidataanalytics.Credentials()
credentials.oauth.secret.client_id = looker_client_id
credentials.oauth.secret.client_secret = looker_client_secret

datasource_references = geminidataanalytics.DatasourceReferences()
datasource_references.looker.explore_references = [looker_explore_reference, looker_explore_reference2]

# Do not include the following line during agent creation
datasource_references.credentials = credentials

サンプル値を次のように置き換えます。

my_access_token: Looker の認証用に生成する access_token 値。
https://my_company.looker.com: Looker インスタンスの完全な URL。
my_model: 接続する Explore を含む LookML モデルの名前。
my_explore: データエージェントがクエリを実行する Looker Explore の名前。
my_model_2: 接続する Explore を含む 2 番目の LookML モデルの名前。この変数は、最大 5 つの Explore の追加モデルに対して繰り返すことができます。
my_explore_2: データエージェントがクエリを実行する追加の Looker Explore の名前。この変数を繰り返して、最大 5 つの探索を含めることができます。

BigQuery データに接続する

Conversational Analytics API では、接続できる BigQuery テーブルの数に上限はありません。ただし、多数のテーブルに接続すると、精度が低下したり、モデルの入力トークン上限を超えたりする可能性があります。

次のサンプルコードは、複数の BigQuery テーブルへの接続を定義し、オプションの構造化コンテキストフィールドの例を示しています。エージェントのパフォーマンスを向上させるために、テーブルと列の説明、同義語、タグ、クエリの例など、BigQuery テーブルの構造化コンテキストを必要に応じて指定できます。詳細については、BigQuery データソースのデータエージェントコンテキストを定義するをご覧ください。

bigquery_table_reference_1 = geminidataanalytics.BigQueryTableReference()
bigquery_table_reference_1.project_id = "my_project_id_1"
bigquery_table_reference_1.dataset_id = "my_dataset_id_1"
bigquery_table_reference_1.table_id = "my_table_id_1"
bigquery_table_reference_1.schema = geminidataanalytics.Schema()
bigquery_table_reference_1.schema.description = "my_table_description"
bigquery_table_reference_1.schema.fields = [
    geminidataanalytics.Field(
        name="my_column_name",
        description="my_column_description"
    )
]

bigquery_table_reference_2 = geminidataanalytics.BigQueryTableReference()
bigquery_table_reference_2.project_id = "my_project_id_2"
bigquery_table_reference_2.dataset_id = "my_dataset_id_2"
bigquery_table_reference_2.table_id = "my_table_id_2"

bigquery_table_reference_3 = geminidataanalytics.BigQueryTableReference()
bigquery_table_reference_3.project_id = "my_project_id_3"
bigquery_table_reference_3.dataset_id = "my_dataset_id_3"
bigquery_table_reference_3.table_id = "my_table_id_3"

# Connect to your data source
datasource_references = geminidataanalytics.DatasourceReferences()
datasource_references.bq.table_references = [bigquery_table_reference_1, bigquery_table_reference_2, bigquery_table_reference_3]

サンプル値を次のように置き換えます。

my_project_id_1: 接続する BigQuery データセットとテーブルを含む Google Cloud プロジェクトの ID。公開データセットに接続するには、bigquery-public-data を指定します。
my_dataset_id_1: BigQuery データセットの ID。例: san_francisco
my_table_id_1: BigQuery テーブルの ID。例: street_trees
my_table_description: テーブルの内容と目的の説明（省略可）。
my_column_name: 省略可能な説明を指定するテーブルの列の名前。
my_column_description: 列の内容と目的の説明（省略可）。

Looker Studio データに接続する

次のサンプルコードは、Looker Studio データソースへの接続を定義します。

studio_datasource_id = "my_datasource_id"

studio_references = geminidataanalytics.StudioDatasourceReference()
studio_references.datasource_id = studio_datasource_id

## Connect to your data source
datasource_references.studio.studio_references = [studio_references]

前の例では、my_datasource_id をデータソース ID に置き換えます。

ステートフルまたはステートレスチャットのコンテキストを設定する

会話分析 API はマルチターンの会話をサポートしています。これにより、ユーザーは以前のコンテキストに基づいてフォローアップの質問を実施できます。次の Python サンプルコードは、ステートフル チャットまたはステートレス チャットのコンテキストを設定する方法を示しています。

ステートフルリクエスト: Google Cloud が会話履歴を保存して管理します。ステートフルチャットは、API が以前のメッセージのコンテキストを保持するため、本質的にマルチターンです。各ターンで現在のメッセージのみを送信します。
ステートレスチャット: アプリケーションが会話履歴を管理します。新しいメッセージには、会話履歴全体を含める必要があります。ステートレスモードでマルチターン会話を管理する方法の詳細な例については、ステートレスマルチターン会話を作成するをご覧ください。

ステートフルチャット

次のコードサンプルは、ステートフルチャットのコンテキストを設定します。ここで、 Google Cloud は会話履歴を保存して管理します。次のサンプルコードに published_context.options.analysis.python.enabled = True 行を含めることで、Python を使用した高度な分析を有効にすることもできます。

# Set up context for stateful chat
published_context = geminidataanalytics.Context()
published_context.system_instruction = system_instruction
published_context.datasource_references = datasource_references
# Optional: To enable advanced analysis with Python, include the following line:
published_context.options.analysis.python.enabled = True

ステートレスチャット

次のサンプルコードは、ステートレスチャットのコンテキストを設定します。ステートレスチャットでは、各メッセージで会話履歴全体を送信する必要があります。次のサンプルコードに inline_context.options.analysis.python.enabled = True 行を含めることで、Python を使用した高度な分析を有効にすることもできます。

# Set up context for stateless chat
# datasource_references.looker.credentials = credentials
inline_context = geminidataanalytics.Context()
inline_context.system_instruction = system_instruction
inline_context.datasource_references = datasource_references
# Optional: To enable advanced analysis with Python, include the following line:
inline_context.options.analysis.python.enabled = True

データエージェントを作成する

次の Python コードのサンプルは、API リクエストを実行してデータエージェントを作成します。このデータエージェントを使用して、データに関する会話を行うことができます。データエージェントは、指定されたデータソース、システム指示、コンテキストで構成されます。

data_agent_id = "data_agent_1"

data_agent = geminidataanalytics.DataAgent()
data_agent.data_analytics_agent.published_context = published_context
data_agent.name = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}" # Optional

request = geminidataanalytics.CreateDataAgentRequest(
    parent=f"projects/{billing_project}/locations/global",
    data_agent_id=data_agent_id, # Optional
    data_agent=data_agent,
)

try:
    data_agent_client.create_data_agent(request=request)
    print("Data Agent created")
except Exception as e:
    print(f"Error creating Data Agent: {e}")

前の例では、値 data_agent_1 をデータエージェントの固有識別子に置き換えます。

会話を作成する

次の Python コードサンプルは、API リクエストを実行して会話を作成します。

# Initialize request arguments
data_agent_id = "data_agent_1"
conversation_id = "conversation_1"

conversation = geminidataanalytics.Conversation()
conversation.agents = [f'projects/{billing_project}/locations/global/dataAgents/{data_agent_id}']
conversation.name = f"projects/{billing_project}/locations/global/conversations/{conversation_id}"

request = geminidataanalytics.CreateConversationRequest(
    parent=f"projects/{billing_project}/locations/global",
    conversation_id=conversation_id,
    conversation=conversation,
)

# Make the request
response = data_chat_client.create_conversation(request=request)

# Handle the response
print(response)

サンプル値を次のように置き換えます。

data_agent_1: データエージェントを作成するのサンプルコードブロックで定義されているデータエージェントの ID。
conversation_1: 会話の固有識別子。

データエージェントと会話を管理する

次のコードサンプルは、Conversational Analytics API を使用してデータエージェントと会話を管理する方法を示しています。次のタスクに有用です。

データエージェントを取得する
データエージェントの一覧を取得する
アクセス可能なデータエージェントの一覧を取得する
データエージェントを更新する
データエージェントの IAM ポリシーを取得する
データエージェントの IAM ポリシーを設定する
データエージェントを削除する
会話を取得する
スレッドのリストを取得する
会話内のメッセージを一覧で取得する

データエージェントを取得する

次の Python コードサンプルは、以前に作成したデータエージェントを取得する API リクエストを行う方法を示しています。

# Initialize request arguments
data_agent_id = "data_agent_1"
request = geminidataanalytics.GetDataAgentRequest(
    name=f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}",
)

# Make the request
response = data_agent_client.get_data_agent(request=request)

# Handle the response
print(response)

前の例で、値 data_agent_1 は、取得するデータエージェントの固有識別子に置き換えます。

データエージェントの一覧を取得する

次のコードは、list_data_agents メソッドを呼び出して、特定のプロジェクトのすべてのデータエージェントを一覧表示する方法を示しています。すべてのエージェントを一覧表示するには、プロジェクトに対する geminidataanalytics.dataAgents.list 権限が必要です。この権限を含む IAM ロールの詳細については、事前定義ロールのリストをご覧ください。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
request = geminidataanalytics.ListDataAgentsRequest(
    parent=f"projects/{billing_project}/locations/global",
)

# Make the request
page_result = data_agent_client.list_data_agents(request=request)

# Handle the response
for response in page_result:
    print(response)

YOUR-BILLING-PROJECT は、課金プロジェクトの ID に置き換えます。

アクセス可能なデータエージェントの一覧を取得する

次のコードは、list_accessible_data_agents メソッドを呼び出して、特定のプロジェクトで使用可能なすべてのデータエージェントを一覧表示する方法を示しています。

billing_project = "YOUR-BILLING-PROJECT"
creator_filter = "YOUR-CREATOR-FILTER"
location = "global"
request = geminidataanalytics.ListAccessibleDataAgentsRequest(
    parent=f"projects/{billing_project}/locations/global",
    creator_filter=creator_filter
)

# Make the request
page_result = data_agent_client.list_accessible_data_agents(request=request)

# Handle the response
for response in page_result:
    print(response)

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
YOUR-CREATOR-FILTER: データエージェントの作成者に基づいて適用するフィルタ。有効な値は NONE（デフォルト）、CREATOR_ONLY、NOT_CREATOR_ONLY です。

データエージェントを更新する

次のサンプルコードは、データエージェントリソースで update_data_agent メソッドを呼び出してデータエージェントを更新する方法を示しています。リクエストには、変更するフィールドの新しい値を含む DataAgent オブジェクトと、更新するフィールドを指定する FieldMask オブジェクトを受け取る update_mask パラメータが必要です。

データエージェントを更新するには、そのエージェントに対する geminidataanalytics.dataAgents.update IAM 権限が必要です。この権限を含む IAM ロールの詳細については、事前定義ロールのリストをご覧ください。

data_agent_id = "data_agent_1"
billing_project = "YOUR-BILLING-PROJECT"
data_agent = geminidataanalytics.DataAgent()
data_agent.data_analytics_agent.published_context = published_context
data_agent.name = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"
data_agent.description = "Updated description of the data agent."

update_mask = field_mask_pb2.FieldMask(paths=['description', 'data_analytics_agent.published_context'])

request = geminidataanalytics.UpdateDataAgentRequest(
    data_agent=data_agent,
    update_mask=update_mask,
)

try:
    # Make the request
    data_agent_client.update_data_agent(request=request)
    print("Data Agent Updated")
except Exception as e:
    print(f"Error updating Data Agent: {e}")

サンプル値を次のように置き換えます。

data_agent_1: 更新するデータエージェントの ID。
YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
Updated description of the data agent.: 更新されたデータエージェントの説明。

データエージェントの IAM ポリシーを取得する

次のサンプルコードは、get_iam_policy メソッドを使用してデータエージェントの IAM ポリシーを取得する方法を示しています。リクエストでデータエージェントのリソースパスを指定します。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
data_agent_id = "data_agent_1"

resource = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"
request = iam_policy_pb2.GetIamPolicyRequest(
            resource=resource,
        )
try:
    response = data_agent_client.get_iam_policy(request=request)
    print("IAM Policy fetched successfully!")
    print(f"Response: {response}")
except Exception as e:
    print(f"Error setting IAM policy: {e}")

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
data_agent_1: IAM ポリシーを取得するデータエージェントの ID。

データエージェントの IAM ポリシーを設定する

エージェントを共有するには、set_iam_policy メソッドを使用して、特定のエージェントのユーザーに IAM ロールを割り当てます。リクエストには、どのユーザーにどのロールを割り当てるかを指定するバインディングが含まれています。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
data_agent_id = "data_agent_1"
role = "roles/geminidataanalytics.dataAgentEditor"
users = "222larabrown@gmail.com, cloudysanfrancisco@gmail.com"

resource = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"

# Construct the IAM policy
binding = policy_pb2.Binding(
    role=role,
    members= [f"user:{i.strip()}" for i in users.split(",")]
)

policy = policy_pb2.Policy(bindings=[binding])

# Create the request
request = iam_policy_pb2.SetIamPolicyRequest(
    resource=resource,
    policy=policy
)

# Send the request
try:
    response = data_agent_client.set_iam_policy(request=request)
    print("IAM Policy set successfully!")
    print(f"Response: {response}")
except Exception as e:
    print(f"Error setting IAM policy: {e}")

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
data_agent_1: IAM ポリシーを設定するデータエージェントの ID。
222larabrown@gmail.com, cloudysanfrancisco@gmail.com: 指定したロールを付与するユーザーのメールアドレスのカンマ区切りのリスト。

データエージェントを削除する

次のサンプルコードは、delete_data_agent メソッドを使用してデータエージェントを削除（復元可能）する方法を示しています。エージェントをこのように削除すると、エージェントは削除されますが、30 日以内であれば復元可能です。リクエストでは、削除対象のデータエージェントのリソース URL を指定します。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
data_agent_id = "data_agent_1"

request = geminidataanalytics.DeleteDataAgentRequest(
    name=f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}",
)

try:
    # Make the request
    data_agent_client.delete_data_agent(request=request)
    print("Data Agent Deleted")
except Exception as e:
    print(f"Error deleting Data Agent: {e}")

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
data_agent_1: 削除するデータエージェントの ID。

会話を取得する

次のサンプルコードは、get_conversation メソッドを使用して既存の会話に関する情報を取得する方法を示しています。リクエストで会話のリソースパスを指定します。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
conversation_id = "conversation_1"

request = geminidataanalytics.GetConversationRequest(
    name = f"projects/{billing_project}/locations/global/conversations/{conversation_id}"
)

# Make the request
response = data_chat_client.get_conversation(request=request)

# Handle the response
print(response)

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
conversation_1: 取得する会話の ID。

スレッドのリストを取得する

次のサンプルコードは、list_conversations メソッドを呼び出して、特定のプロジェクトの会話を一覧表示する方法を示しています。リクエストでは、親リソースの URL を指定します。この親リソースとは、プロジェクトとロケーションを指します（例: projects/my-project/locations/global）。

デフォルトでは、このメソッドは作成した会話を返します。管理者（cloudaicompanion.topicAdmin IAM ロールを持つユーザー）は、プロジェクト内のすべての会話を表示できます。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
request = geminidataanalytics.ListConversationsRequest(
    parent=f"projects/{billing_project}/locations/global",
)

# Make the request
response = data_chat_client.list_conversations(request=request)

# Handle the response
print(response)

YOUR-BILLING-PROJECT は、必要な API を有効にした課金プロジェクトの ID に置き換えます。

会話内のメッセージを一覧で取得する

次のサンプルコードは、list_messages メソッドを使用して会話内のすべてのメッセージを取得する方法を示しています。リクエストで会話のリソースパスを指定します。

メッセージを一覧表示するには、会話に対する cloudaicompanion.topics.get 権限が必要です。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"

conversation_id = "conversation_1"

request = geminidataanalytics.ListMessagesRequest(
    parent=f"projects/{billing_project}/locations/global/conversations/{conversation_id}",
)

# Make the request
response = data_chat_client.list_messages(request=request)

# Handle the response
print(response)

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
conversation_1: メッセージを一覧表示する会話の ID。

会話を削除する

次のサンプルコードは、会話を削除する方法を示しています。管理者（cloudaicompanion.topicAdmin Identity and Access Management ロールを持つユーザー）または cloudaicompanion.topics.delete Identity and Access Management 権限を持つユーザーであれば、プロジェクト内の会話を削除できます。

billing_project = "YOUR-BILLING-PROJECT"
location = "global"
conversation_id = "conversation_1"

request = geminidataanalytics.DeleteConversationRequest(
    name = f"projects/{billing_project}/locations/global/conversations/{conversation_id}"
)

# Make the request
response = data_chat_client.delete_conversation(request=request)

# Handle the response
print(response)

サンプル値を次のように置き換えます。

YOUR-BILLING-PROJECT: 課金プロジェクトの ID。
conversation_1: メッセージを一覧表示する会話の ID。

API を使用して質問する

データエージェントと会話を作成したら、次の Python コードのサンプルを使用してエージェントにクエリを送信します。このコードでは、ステートフルチャットまたはステートレスチャット用に設定したコンテキストを使用します。API は、エージェントがクエリに回答するために行う手順を表すメッセージストリームを返します。

ステートフルチャット

`Conversation` 参照を含むステートフルチャットリクエストを送信する

以前に作成した Conversation リソースを参照することで、ステートフルチャットリクエストをデータエージェントに送信できます。

# Create a request that contains a single user message (your question)
question = "Which species of tree is most prevalent?"
messages = [geminidataanalytics.Message()]
messages[0].user_message.text = question

data_agent_id = "data_agent_1"
conversation_id = "conversation_1"

# Create a conversation_reference
conversation_reference = geminidataanalytics.ConversationReference()
conversation_reference.conversation = f"projects/{billing_project}/locations/global/conversations/{conversation_id}"
conversation_reference.data_agent_context.data_agent = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"
# conversation_reference.data_agent_context.credentials = credentials

# Form the request
request = geminidataanalytics.ChatRequest(
    parent = f"projects/{billing_project}/locations/global",
    messages = messages,
    conversation_reference = conversation_reference
)

# Make the request
stream = data_chat_client.chat(request=request, timeout=300 #custom timeout up to 600s)

# Handle the response
for response in stream:
    show_message(response)

サンプル値を次のように置き換えます。

Which species of tree is most prevalent?: データエージェントに送信する自然言語の質問。
data_agent_1: データエージェントを作成するで定義されている、データエージェントの固有識別子。
conversation_1: 会話を作成するで定義されている、会話の固有識別子。

ステートレスチャット

次のコードサンプルは、ステートレスチャットのコンテキストを設定したときにデータエージェントにクエリを送信する方法を示しています。ステートレスクエリを送信するには、以前に定義した DataAgent リソースを参照するか、リクエストでインラインコンテキストを使用します。

`DataAgent` 参照を使用してステートレスチャットリクエストを送信する

以前に作成した DataAgent リソースを参照して、データエージェントにクエリを送信できます。

# Create a request that contains a single user message (your question)
question = "Which species of tree is most prevalent?"
messages = [geminidataanalytics.Message()]
messages[0].user_message.text = question

data_agent_id = "data_agent_1"

data_agent_context = geminidataanalytics.DataAgentContext()
data_agent_context.data_agent = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"
# data_agent_context.credentials = credentials

# Form the request
request = geminidataanalytics.ChatRequest(
    parent=f"projects/{billing_project}/locations/global",
    messages=messages,
    data_agent_context = data_agent_context
)

# Make the request
stream = data_chat_client.chat(request=request, timeout=300 #custom timeout up to 600s)

# Handle the response
for response in stream:
    show_message(response)

サンプル値を次のように置き換えます。

Which species of tree is most prevalent?: データエージェントに送信する自然言語の質問。
data_agent_1: データエージェントを作成するで定義されている、データエージェントの固有識別子。

インラインコンテキストを含むステートレスチャットリクエストを送信する

次のサンプルコードは、inline_context パラメータを使用して、ステートレスチャットリクエスト内でコンテキストを直接提供する方法を示しています。

# Create a request that contains a single user message (your question)
question = "Which species of tree is most prevalent?"
messages = [geminidataanalytics.Message()]
messages[0].user_message.text = question

request = geminidataanalytics.ChatRequest(
    inline_context=inline_context,
    parent=f"projects/{billing_project}/locations/global",
    messages=messages,
)

# Make the request
stream = data_chat_client.chat(request=request, timeout=300 #custom timeout up to 600s)

# Handle the response
for response in stream:
    show_message(response)

前の例では、Which species of tree is most prevalent? をデータエージェントに送信する自然言語の質問に置き換えます。

ステートレスマルチターンの会話を作成する

ステートレスな会話でフォローアップの質問をするには、アプリケーションで新しいリクエストごとにメッセージ履歴全体を送信して、会話のコンテキストを管理する必要があります。次の例は、データエージェントを参照するか、インラインコンテキストを使用してデータソースを直接指定して、マルチターン会話を作成する方法を示しています。

# List that is used to track previous turns and is reused across requests
conversation_messages = []

data_agent_id = "data_agent_1"

# Use data agent context
data_agent_context = geminidataanalytics.DataAgentContext()
data_agent_context.data_agent = f"projects/{billing_project}/locations/global/dataAgents/{data_agent_id}"
# data_agent_context.credentials = credentials

# Helper function for calling the API
def multi_turn_Conversation(msg):

    message = geminidataanalytics.Message()
    message.user_message.text = msg

    # Send a multi-turn request by including previous turns and the new message
    conversation_messages.append(message)

    request = geminidataanalytics.ChatRequest(
        parent=f"projects/{billing_project}/locations/global",
        messages=conversation_messages,
        # Use data agent context
        data_agent_context=data_agent_context,
        # Use inline context
        # inline_context=inline_context,
    )

    # Make the request
    stream = data_chat_client.chat(request=request, timeout=300 #custom timeout up to 600s)

    # Handle the response
    for response in stream:
      show_message(response)
      conversation_messages.append(response)

# Send the first turn request
multi_turn_Conversation("Which species of tree is most prevalent?")

# Send follow-up turn request
multi_turn_Conversation("Can you show me the results as a bar chart?")

前の例では、サンプル値を次のように置き換えます。

data_agent_1: データエージェントを作成するのサンプルコードブロックで定義されている、データエージェントの固有識別子。
Which species of tree is most prevalent?: データエージェントに送信する自然言語の質問。
Can you show me the results as a bar chart?: 前の質問を基にする、または前の質問を絞り込むフォローアップの質問。

ヘルパー関数を定義する

次のサンプルコードには、前のコードサンプルで使用されているヘルパー関数の定義が含まれています。これらの関数は、API からのレスポンスを解析して結果を表示するのに役立ちます。

from pygments import highlight, lexers, formatters
import pandas as pd
import requests
import json as json_lib
import altair as alt
import IPython
from IPython.display import display, HTML

import proto
from google.protobuf.json_format import MessageToDict, MessageToJson

def handle_text_response(resp):
  parts = getattr(resp, 'parts')
  print(''.join(parts))

def display_schema(data):
  fields = getattr(data, 'fields')
  df = pd.DataFrame({
    "Column": map(lambda field: getattr(field, 'name'), fields),
    "Type": map(lambda field: getattr(field, 'type'), fields),
    "Description": map(lambda field: getattr(field, 'description', '-'), fields),
    "Mode": map(lambda field: getattr(field, 'mode'), fields)
  })
  display(df)

def display_section_title(text):
  display(HTML('<h2>{}</h2>'.format(text)))

def format_looker_table_ref(table_ref):
 return 'lookmlModel: {}, explore: {}, lookerInstanceUri: {}'.format(table_ref.lookml_model, table_ref.explore, table_ref.looker_instance_uri)

def format_bq_table_ref(table_ref):
  return '{}.{}.{}'.format(table_ref.project_id, table_ref.dataset_id, table_ref.table_id)

def display_datasource(datasource):
  source_name = ''
  if 'studio_datasource_id' in datasource:
   source_name = getattr(datasource, 'studio_datasource_id')
  elif 'looker_explore_reference' in datasource:
   source_name = format_looker_table_ref(getattr(datasource, 'looker_explore_reference'))
  else:
    source_name = format_bq_table_ref(getattr(datasource, 'bigquery_table_reference'))

  print(source_name)
  display_schema(datasource.schema)

def handle_schema_response(resp):
  if 'query' in resp:
    print(resp.query.question)
  elif 'result' in resp:
    display_section_title('Schema resolved')
    print('Data sources:')
    for datasource in resp.result.datasources:
      display_datasource(datasource)

def handle_data_response(resp):
  if 'query' in resp:
    query = resp.query
    display_section_title('Retrieval query')
    print('Query name: {}'.format(query.name))
    print('Question: {}'.format(query.question))
    print('Data sources:')
    for datasource in query.datasources:
      display_datasource(datasource)
  elif 'generated_sql' in resp:
    display_section_title('SQL generated')
    print(resp.generated_sql)
  elif 'result' in resp:
    display_section_title('Data retrieved')

    fields = [field.name for field in resp.result.schema.fields]
    d = {}
    for el in resp.result.data:
      for field in fields:
        if field in d:
          d[field].append(el[field])
        else:
          d[field] = [el[field]]

    display(pd.DataFrame(d))

def handle_chart_response(resp):
  def _value_to_dict(v):
    if isinstance(v, proto.marshal.collections.maps.MapComposite):
      return _map_to_dict(v)
    elif isinstance(v, proto.marshal.collections.RepeatedComposite):
      return [_value_to_dict(el) for el in v]
    elif isinstance(v, (int, float, str, bool)):
      return v
    else:
      return MessageToDict(v)

  def _map_to_dict(d):
    out = {}
    for k in d:
      if isinstance(d[k], proto.marshal.collections.maps.MapComposite):
        out[k] = _map_to_dict(d[k])
      else:
        out[k] = _value_to_dict(d[k])
    return out

  if 'query' in resp:
    print(resp.query.instructions)
  elif 'result' in resp:
    vegaConfig = resp.result.vega_config
    vegaConfig_dict = _map_to_dict(vegaConfig)
    alt.Chart.from_json(json_lib.dumps(vegaConfig_dict)).display();

def show_message(msg):
  m = msg.system_message
  if 'text' in m:
    handle_text_response(getattr(m, 'text'))
  elif 'schema' in m:
    handle_schema_response(getattr(m, 'schema'))
  elif 'data' in m:
    handle_data_response(getattr(m, 'data'))
  elif 'chart' in m:
    handle_chart_response(getattr(m, 'chart'))
  print('\n')

Python SDK を使用してデータ エージェントを構築する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

環境の認証と設定を行う

課金プロジェクトとシステム指示を指定する

データソースに接続する

Looker データに接続する

API キー

アクセス トークン

BigQuery データに接続する

Looker Studio データに接続する

ステートフルまたはステートレス チャットのコンテキストを設定する

ステートフル チャット

ステートレス チャット

データ エージェントを作成する

会話を作成する

データ エージェントと会話を管理する

データ エージェントを取得する

データ エージェントの一覧を取得する

アクセス可能なデータ エージェントの一覧を取得する

データ エージェントを更新する

データ エージェントの IAM ポリシーを取得する

データ エージェントの IAM ポリシーを設定する

データ エージェントを削除する

会話を取得する

スレッドのリストを取得する

会話内のメッセージを一覧で取得する

会話を削除する

API を使用して質問する

ステートフル チャット

Conversation 参照を含むステートフル チャット リクエストを送信する

ステートレス チャット

DataAgent 参照を使用してステートレス チャット リクエストを送信する

インライン コンテキストを含むステートレス チャット リクエストを送信する

ステートレス マルチターンの会話を作成する

ヘルパー関数を定義する

Python SDK を使用してデータエージェントを構築する

アクセストークン

ステートフルまたはステートレスチャットのコンテキストを設定する

ステートフルチャット

ステートレスチャット

データエージェントを作成する

データエージェントと会話を管理する

データエージェントを取得する

データエージェントの一覧を取得する

アクセス可能なデータエージェントの一覧を取得する

データエージェントを更新する

データエージェントの IAM ポリシーを取得する

データエージェントの IAM ポリシーを設定する

データエージェントを削除する

ステートフルチャット

`Conversation` 参照を含むステートフルチャットリクエストを送信する

ステートレスチャット

`DataAgent` 参照を使用してステートレスチャットリクエストを送信する

インラインコンテキストを含むステートレスチャットリクエストを送信する

ステートレスマルチターンの会話を作成する