Google Cloud Hier erfahren Sie, wie Sie mit dem Gen AI Evaluation Service in der Google-Konsole beginnen.
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
Modell bewerten
So bewerten Sie Ihr Modell:
Rufen Sie in der Google Cloud Console die Seite „Gen AI Evaluation“ auf.
Klicken Sie auf Neue Bewertung, um die Bewertungsseite zu öffnen.
Wählen Sie eine Quelle aus, um ein Dataset für die Bewertung zu laden:
Wenn Sie eine lokale CSV- oder JSONL-Datei hochladen möchten, wählen Sie Datei hochladen aus. Das Dataset muss entweder Prompts oder Datensätze enthalten, die in einer Promptvorlage verwendet werden können, und optional Modellantworten. Der Maximalwert beträgt 200 Zeilen.
Wenn Sie Prompts aus einer Promptvorlage generieren möchten, wählen Sie Daten generieren aus. Der Gen AI Evaluation Service generiert und füllt die Variablen, die Sie beim Erstellen des Datasets in Ihrer Promptvorlage definiert haben. Weitere Informationen zum Erstellen von Promptvorlagen finden Sie unter Promptvorlagen verwenden.
Geben Sie Ihre Prompt-Vorlage mit Ihren Variablen in das Feld Prompt-Vorlage ein.
Wenn Sie eine Beschreibung für jede Ihrer Variablen hinzufügen oder die Anzahl der zu generierenden Stichproben angeben möchten, maximieren Sie Variablen und Stichprobengröße definieren.
Klicken Sie auf Dataset generieren, um Prompts zu generieren.
Antworten auf Grundlage Ihrer Prompts generieren und bewerten:
Klicken Sie im Abschnitt Evaluierungskandidaten auf Evaluierungskandidaten hinzufügen. Wenn bereits ein Kandidat vorhanden ist, klicken Sie auf Bearbeiten, um die zu bewertenden Prompts und Antworten zu definieren. Sie können beispielsweise Prompts oder Antworten aus der hochgeladenen Datei oder aus generierten Daten angeben.
Wenn Sie mehrere Kandidaten vergleichen möchten, klicken Sie auf Vergleichskandidaten hinzufügen.
Fügen Sie im Bereich Messwerte mindestens einen Messwert hinzu, um die Qualität der Antworten des Kandidaten zu bewerten. Weitere Informationen zu den Messwerttypen finden Sie im Abschnitt Bewertungsmesswerte auf der Übersichtsseite zum Gen AI Evaluation Service.
Bei einigen adaptiven Rubriken können Sie die Rubriken, die aus den einzelnen Prompts generiert werden, steuern. Klicken Sie dazu auf Erweitert und geben Sie benutzerdefinierte Anweisungen ein, z. B.
Evaluate the dataset on cultural sensitivity.- Geben Sie im Bereich Name und Speicherkonfiguration einen Namen für die Auswertung und einen Cloud Storage-Bucket an, in dem die Ergebnisse der Auswertung gespeichert werden.
Klicken Sie auf Bewerten.
Bewertungsergebnisse ansehen
So rufen Sie ein Bewertungsergebnis auf:
Rufen Sie in der Google Cloud Console die Seite GenAI Evaluation auf.
Klicken Sie auf den Namen der Bewertung.
Für jeden Prompt in Ihrem Bewertungs-Dataset wird die Antwort zusammen mit den Bewertungsergebnissen angezeigt.
Partnermodelle bewerten
Mit dem Gen AI Evaluation Service können Sie die folgenden Partnermodelle bewerten:
- Anthropic
- Llama
Partnermodelle werden über den Model Garden der Gemini Enterprise Agent Platform unterstützt. Sie müssen ein Partnermodell in Model Garden aktivieren, bevor Sie es für die Bewertung auswählen können. Wenn Sie ein Partnermodell bewerten möchten, wählen Sie es bei der Einrichtung der Bewertung im Menü zur Modellauswahl aus.
Preise
Die Preise für die Bewertung von Drittanbietermodellen basieren auf den Gebühren, die für die Modellinferenz im Model Garden der Gemini Enterprise Agent Platform anfallen. Weitere Informationen finden Sie auf der Preisseite für generative KI auf der Agent Platform.