Anleitung: Bewertung mit dem GenAI-Client im Agent Platform SDK durchführen

Auf dieser Seite erfahren Sie, wie Sie Ihre auf generativer KI basierenden Modelle und Anwendungen für eine Reihe von Anwendungsfällen mit dem GenAI-Client im Agent Platform SDK bewerten können.

Hinweis

  1. Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

    In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

    Verify that billing is enabled for your Google Cloud project.

    In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

    Verify that billing is enabled for your Google Cloud project.

  2. Installieren Sie das Agent Platform SDK:

    !pip install google-cloud-aiplatform[evaluation]
    
  3. Anmeldedaten einrichten Wenn Sie diese Anleitung in Colaboratory ausführen, führen Sie Folgendes aus:

    from google.colab import auth
    auth.authenticate_user()
    

    Informationen zu anderen Umgebungen finden Sie unter Bei der Agent-Plattform authentifizieren.

GenAI-Client initialisieren

Führen Sie Folgendes aus, um den GenAI-Client zu initialisieren:

from vertexai import Client

client = Client(project="YOUR_PROJECT_ID", location="YOUR_LOCATION")

Wobei:

  • YOUR_PROJECT_ID: Projekt-ID in Google Cloud .
  • YOUR_LOCATION: Ihre Cloud-Region, z. B. us-central1.

Antworten generieren

Modellantworten für Ihr Dataset mit run_inference() generieren:

  1. Bereiten Sie Ihr Dataset als Pandas DataFrame vor:

    import pandas as pd
    
    eval_df = pd.DataFrame({
      "prompt": [
          "Explain software 'technical debt' using a concise analogy of planting a garden.",
          "Write a Python function to find the nth Fibonacci number using recursion with memoization, but without using any imports.",
          "Write a four-line poem about a lonely robot, where every line must be a question and the word 'and' cannot be used.",
          "A drawer has 10 red socks and 10 blue socks. In complete darkness, what is the minimum number of socks you must pull out to guarantee you have a matching pair?",
          "An AI discovers a cure for a major disease, but the cure is based on private data it analyzed without consent. Should the cure be released? Justify your answer."
      ]
    })
    
  2. Modellantworten mit run_inference() generieren:

    eval_dataset = client.evals.run_inference(
      model="gemini-2.5-flash",
      src=eval_df,
    )
    
  3. Visualisieren Sie Ihre Inferenz-Ergebnisse, indem Sie .show() für das EvaluationDataset-Objekt aufrufen, um die Ausgaben des Modells zusammen mit Ihren ursprünglichen Prompts und Referenzen zu prüfen:

    eval_dataset.show()
    

Das folgende Bild zeigt das Bewertungs-Dataset mit Prompts und den entsprechenden generierten Antworten:

Eine Tabelle mit einem Bewertungs-Dataset mit Spalten für Prompts und Antworten.

Bewertung ausführen

Führen Sie evaluate() aus, um die Modellantworten zu bewerten:

  1. Bewerten Sie die Modellantworten mit dem standardmäßigen GENERAL_QUALITY adaptiven Messwert auf Grundlage von Bewertungsschemas:

    eval_result = client.evals.evaluate(dataset=eval_dataset)
    
  2. Bewertungsergebnisse visualisieren: Rufen Sie .show() für das EvaluationResult-Objekt auf, um zusammenfassende Messwerte und detaillierte Ergebnisse anzuzeigen:

    eval_result.show()
    

Das folgende Bild zeigt einen Bewertungsbericht mit zusammenfassenden Messwerten und detaillierten Ergebnissen für jedes Prompt-Antwort-Paar.

Ein Bewertungsbericht mit zusammenfassenden Messwerten und detaillierten Ergebnissen für jedes Prompt-Antwort-Paar.

Bereinigen

In dieser Anleitung werden keine Gemini Enterprise Agent Platform-Ressourcen erstellt.

Nächste Schritte