Pode usar o serviço de avaliação de IA gen para avaliar a capacidade do agente de concluir tarefas e alcançar objetivos para um determinado exemplo de utilização.
Esta página mostra-lhe como criar e implementar um agente básico e usar o serviço de avaliação de IA gen para avaliar o agente:
Desenvolva um agente: defina um agente com funções de ferramentas básicas.
Implemente um agente: implemente o agente no tempo de execução do Vertex AI Agent Engine.
Executar inferência do agente: defina um conjunto de dados de avaliação e execute a inferência do agente para gerar respostas.
Criar execução de avaliação: crie uma execução de avaliação para realizar a avaliação.
Veja os resultados da avaliação: veja os resultados da avaliação através da execução da avaliação.
Antes de começar
-
Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Verify that billing is enabled for your Google Cloud project.
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Verify that billing is enabled for your Google Cloud project.
Instale o SDK Vertex AI para Python:
%pip install google-cloud-aiplatform[adk,agent_engines] %pip install --upgrade --force-reinstall -q google-cloud-aiplatform[evaluation]Configure as suas credenciais. Se estiver a executar este tutorial no Colaboratory, execute o seguinte:
from google.colab import auth auth.authenticate_user()Para outros ambientes, consulte o artigo Autenticação no Vertex AI.
Inicialize o cliente de IA gen no SDK Vertex AI:
import vertexai from vertexai import Client from google.genai import types as genai_types GCS_DEST = "gs://BUCKET_NAME/output-path" vertexai.init( project=PROJECT_ID, location=LOCATION, ) client = Client( project=PROJECT_ID, location=LOCATION, http_options=genai_types.HttpOptions(api_version="v1beta1"), )Substitua o seguinte:
BUCKET_NAME: nome do contentor do Cloud Storage. Consulte o artigo Crie um contentor para saber mais sobre a criação de contentores.
PROJECT_ID: o ID do projeto.
LOCATION: a região selecionada.
Gere respostas do modelo para o seu conjunto de dados através da API
run_inference():Prepare o seu conjunto de dados como um Pandas DataFrame. Os comandos devem ser específicos do seu agente. As entradas de sessão são necessárias para os rastreios. Para mais informações, consulte o artigo Sessão: acompanhamento de conversas individuais.
import pandas as pd from vertexai import types session_inputs = types.evals.SessionInput( user_id="user_123", state={}, ) agent_prompts = [ "Search for 'noise-cancelling headphones'.", "Show me the details for product 'B08H8H8H8H'.", "Add one pair of 'B08H8H8H8H' to my shopping cart.", "Find 'wireless earbuds' and then add the first result to my cart.", "I need a new laptop for work, can you find one with at least 16GB of RAM?", ] agent_dataset = pd.DataFrame({ "prompt": agent_prompts, "session_inputs": [session_inputs] * len(agent_prompts), })Gere respostas do modelo com
run_inference():agent_dataset_with_inference = client.evals.run_inference( agent=agent_engine_resource_name, src=agent_dataset, )Visualize os resultados da inferência chamando
.show()no objetoEvaluationDatasetpara inspecionar as saídas do modelo juntamente com os comandos e as referências originais:agent_dataset_with_inference.show()A imagem seguinte apresenta o conjunto de dados de avaliação com comandos e os respetivos
intermediate_eventseresponsesgerados:
Recupere o
agent_infoatravés da função auxiliar integrada:agent_info = types.evals.AgentInfo.load_from_agent( my_agent, agent_engine_resource_name )Avalie as respostas do modelo usando métricas adaptativas baseadas em rubricas específicas do agente (
FINAL_RESPONSE_QUALITY,TOOL_USE_QUALITYeHALLUCINATION):evaluation_run = client.evals.create_evaluation_run( dataset=agent_dataset_with_inference, agent_info=agent_info, metrics=[ types.RubricMetric.FINAL_RESPONSE_QUALITY, types.RubricMetric.TOOL_USE_QUALITY, types.RubricMetric.HALLUCINATION, types.RubricMetric.SAFETY, ], dest=GCS_DEST, )- Desenvolva um agente.
- Implemente um agente.
- Use um agente.
- Saiba mais sobre o serviço de avaliação de IA gen
Desenvolva um agente
Desenvolva um agente do Agent Development Kit (ADK) definindo o modelo, a instrução e o conjunto de ferramentas. Para mais informações sobre o desenvolvimento de um agente, consulte o artigo Desenvolva um agente do Agent Development Kit.
from google.adk import Agent
# Define Agent Tools
def search_products(query: str):
"""Searches for products based on a query."""
# Mock response for demonstration
if "headphones" in query.lower():
return {"products": [{"name": "Wireless Headphones", "id": "B08H8H8H8H"}]}
else:
return {"products": []}
def get_product_details(product_id: str):
"""Gets the details for a given product ID."""
if product_id == "B08H8H8H8H":
return {"details": "Noise-cancelling, 20-hour battery life."}
else:
return {"error": "Product not found."}
def add_to_cart(product_id: str, quantity: int):
"""Adds a specified quantity of a product to the cart."""
return {"status": f"Added {quantity} of {product_id} to cart."}
# Define Agent
my_agent = Agent(
model="gemini-2.5-flash",
name='ecommerce_agent',
instruction='You are an ecommerce expert',
tools=[search_products, get_product_details, add_to_cart],
)
Implemente o agente
Implemente o seu agente no tempo de execução do Vertex AI Agent Engine. Esta ação pode demorar até 10 minutos. Obtenha o nome do recurso do agente implementado.
def deploy_adk_agent(root_agent):
"""Deploy agent to agent engine.
Args:
root_agent: The ADK agent to deploy.
"""
app = vertexai.agent_engines.AdkApp(
agent=root_agent,
)
remote_app = client.agent_engines.create(
agent=app,
config = {
"staging_bucket": gs://BUCKET_NAME,
"requirements": ['google-cloud-aiplatform[adk,agent_engines]'],
"env_vars": {"GOOGLE_CLOUD_AGENT_ENGINE_ENABLE_TELEMETRY": "true"}
}
)
return remote_app
agent_engine = deploy_adk_agent(my_agent)
agent_engine_resource_name = agent_engine.api_resource.name
Para ver a lista de agentes implementados no Vertex AI Agent Engine, consulte o artigo Faça a gestão dos agentes implementados.
Gere respostas
Execute a avaliação do agente
Execute create_evaluation_run() para avaliar as respostas do agente.
Veja os resultados da avaliação do agente
Pode ver os resultados da avaliação através do SDK do Vertex AI.
Obtenha a execução da avaliação e visualize os resultados da avaliação chamando
.show() para apresentar métricas de resumo e resultados detalhados:
evaluation_run = client.evals.get_evaluation_run(
name=evaluation_run.name,
include_evaluation_items=True
)
evaluation_run.show()
A imagem seguinte apresenta um relatório de avaliação, que mostra métricas de resumo, informações do agente e resultados detalhados para cada par de comandos-respostas. Os resultados detalhados também incluem rastreios que mostram as interações do agente. Para mais informações sobre rastreios, consulte o artigo Rastreie um agente.

O que se segue?
Experimente os seguintes blocos de notas: