En esta página, se muestra cómo evaluar tus modelos y aplicaciones de IA generativa en una variedad de casos de uso con el cliente de IA generativa en el SDK de Agent Platform.
Antes de comenzar
-
Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Verify that billing is enabled for your Google Cloud project.
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Verify that billing is enabled for your Google Cloud project.
Instala el SDK de Agent Platform:
!pip install google-cloud-aiplatform[evaluation]Configura tus credenciales. Si ejecutas este instructivo en Colaboratory, ejecuta lo siguiente:
from google.colab import auth auth.authenticate_user()Para otros entornos, consulta Autentícate en Agent Platform.
Inicializa el cliente de IA generativa
Para inicializar el cliente de IA generativa, ejecuta lo siguiente:
from vertexai import Client
client = Client(project="YOUR_PROJECT_ID", location="YOUR_LOCATION")
Aquí:
YOUR_PROJECT_ID: Es el ID del proyecto de Google Cloud .YOUR_LOCATION: Tu región de Cloud, por ejemplo,us-central1.
Generar respuestas
Genera respuestas del modelo para tu conjunto de datos con run_inference():
Prepara tu conjunto de datos como un DataFrame de Pandas:
import pandas as pd eval_df = pd.DataFrame({ "prompt": [ "Explain software 'technical debt' using a concise analogy of planting a garden.", "Write a Python function to find the nth Fibonacci number using recursion with memoization, but without using any imports.", "Write a four-line poem about a lonely robot, where every line must be a question and the word 'and' cannot be used.", "A drawer has 10 red socks and 10 blue socks. In complete darkness, what is the minimum number of socks you must pull out to guarantee you have a matching pair?", "An AI discovers a cure for a major disease, but the cure is based on private data it analyzed without consent. Should the cure be released? Justify your answer." ] })Genera respuestas del modelo con
run_inference():eval_dataset = client.evals.run_inference( model="gemini-2.5-flash", src=eval_df, )Visualiza los resultados de la inferencia llamando a
.show()en el objetoEvaluationDatasetpara inspeccionar los resultados del modelo junto con tus instrucciones y referencias originales:eval_dataset.show()
En la siguiente imagen, se muestra el conjunto de datos de evaluación con las instrucciones y sus respuestas generadas correspondientes:

Ejecutar la evaluación
Ejecuta evaluate() para evaluar las respuestas del modelo:
Evalúa las respuestas del modelo con la métrica adaptable basada en rúbricas predeterminada
GENERAL_QUALITY:eval_result = client.evals.evaluate(dataset=eval_dataset)Visualiza los resultados de la evaluación llamando a
.show()en el objetoEvaluationResultpara mostrar las métricas de resumen y los resultados detallados:eval_result.show()
En la siguiente imagen, se muestra un informe de evaluación, que incluye métricas de resumen y resultados detallados para cada par de instrucciones y respuestas.

Realiza una limpieza
Durante este instructivo, no se crean recursos de Gemini Enterprise Agent Platform.