Text mit einem offenen Gemma-Modell und der Funktion AI.GENERATE_TEXT generieren
In dieser Anleitung erfahren Sie, wie Sie ein Remote-Modell erstellen, das auf dem Gemma-Modell basiert. Außerdem wird gezeigt, wie Sie dieses Modell mit der AI.GENERATE_TEXT-Funktion verwenden, um Keywords zu extrahieren und eine Sentimentanalyse für Filmrezensionen aus der öffentlichen Tabelle bigquery-public-data.imdb.reviews durchzuführen.
Erforderliche Berechtigungen
Zum Ausführen dieser Anleitung benötigen Sie die folgenden IAM-Rollen (Identity and Access Management):
- BigQuery-Datasets, ‑Verbindungen und ‑Modelle erstellen und verwenden: BigQuery-Administrator (
roles/bigquery.admin). - Gewähren Sie dem Dienstkonto der Verbindung Berechtigungen: „Projekt-IAM-Administrator“ (
roles/resourcemanager.projectIamAdmin). - Modelle in Vertex AI bereitstellen und die Bereitstellung aufheben: Vertex AI-Administrator (
roles/aiplatform.admin).
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Ausführen der Aufgaben in diesem Dokument erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
- Dataset erstellen:
bigquery.datasets.create - Verbindung erstellen, delegieren und verwenden:
bigquery.connections.* - Standardverbindung festlegen:
bigquery.config.* - Dienstkontoberechtigungen festlegen:
resourcemanager.projects.getIamPolicyundresourcemanager.projects.setIamPolicy - Vertex AI-Modell bereitstellen und die Bereitstellung aufheben:
aiplatform.endpoints.deployaiplatform.endpoints.undeploy
- Modell erstellen und Inferenz ausführen:
bigquery.jobs.createbigquery.models.createbigquery.models.getDatabigquery.models.updateDatabigquery.models.updateMetadata
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Kosten
In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Google Cloud:
- BigQuery ML: You incur costs for the data that you process in BigQuery.
- Vertex AI: You incur costs for calls to the Vertex AI model that's represented by the remote model.
Mit dem Preisrechner können Sie eine Kostenschätzung für Ihre voraussichtliche Nutzung vornehmen.
Weitere Informationen zu den Preisen von BigQuery finden Sie unter BigQuery: Preise in der BigQuery-Dokumentation.
Für offene Modelle, die Sie in Vertex AI bereitstellen, wird pro Maschinenstunde abgerechnet. Das bedeutet, dass die Abrechnung beginnt, sobald der Endpunkt vollständig eingerichtet ist, und fortgesetzt wird, bis Sie ihn deaktivieren. Weitere Informationen zu den Preisen für Vertex AI finden Sie auf der Seite Vertex AI: Preise.
Hinweise
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, BigQuery Connection, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Dataset erstellen
Erstellen Sie ein BigQuery-Dataset zum Speichern Ihres ML-Modells.
Console
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
Klicken Sie auf Aktionen ansehen > Dataset erstellen.
Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
Geben Sie unter Dataset-ID
bqml_tutorialein.Wählen Sie als Standorttyp die Option Mehrere Regionen und dann USA (mehrere Regionen in den USA) aus.
Übernehmen Sie die verbleibenden Standardeinstellungen unverändert und klicken Sie auf Dataset erstellen.
bq
Wenn Sie ein neues Dataset erstellen möchten, verwenden Sie den Befehl bq mk mit dem Flag --location. Eine vollständige Liste der möglichen Parameter finden Sie in der bq mk --dataset-Befehlsreferenz.
Erstellen Sie ein Dataset mit dem Namen
bqml_tutorial, wobei der Datenspeicherort aufUSund die Beschreibung aufBigQuery ML tutorial datasetfestgelegt ist:bq --location=US mk -d \ --description "BigQuery ML tutorial dataset." \ bqml_tutorial
Anstelle des Flags
--datasetverwendet der Befehl die verkürzte Form-d. Wenn Sie-dund--datasetauslassen, wird standardmäßig ein Dataset erstellt.Prüfen Sie, ob das Dataset erstellt wurde:
bq ls
API
Rufen Sie die Methode datasets.insert mit einer definierten Dataset-Ressource auf.
{ "datasetReference": { "datasetId": "bqml_tutorial" } }
BigQuery DataFrames
Bevor Sie dieses Beispiel ausprobieren, folgen Sie den Schritten zur Einrichtung von BigQuery DataFrames in der BigQuery-Kurzanleitung: BigQuery DataFrames verwenden. Weitere Informationen finden Sie in der Referenzdokumentation zu BigQuery DataFrames.
Richten Sie zur Authentifizierung bei BigQuery die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter ADC für eine lokale Entwicklungsumgebung einrichten.
Remote-Modell erstellen
Erstellen Sie ein Remote-Modell, das ein gehostetes Vertex AI-Modell darstellt:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Führen Sie im Abfrageeditor folgende Abfrage aus:
CREATE OR REPLACE MODEL `bqml_tutorial.gemma_model` REMOTE WITH CONNECTION DEFAULT OPTIONS ( MODEL_GARDEN_MODEL_NAME = 'publishers/google/models/gemma3@gemma-3-270m-it', MACHINE_TYPE = 'g2-standard-12' );
Die Abfrage kann bis zu 20 Minuten dauern. Anschließend wird das Modell gemma_model im bqml_tutorial-Dataset des Bereichs Explorer angezeigt. Da die Abfrage eine CREATE MODEL-Anweisung zum Erstellen eines Modells verwendet, gibt es keine Abfrageergebnisse.
Keyword-Extraktion ausführen
Führen Sie mithilfe des Remote-Modells und der AI.GENERATE_TEXT-Funktion die Keyword-Extraktion für IMDB-Filmrezensionen durch:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Geben Sie im Abfrageeditor die folgende Anweisung ein, um eine Schlüsselwortextraktion für 10 Filmrezensionen durchzuführen:
-- This function takes your instruction and wraps it with chat template for -- better output quality. -- This is usually the recommended way when using Gemma instruction-tuned models. CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS ( CONCAT( '<start_of_turn>user\n', user_instruction, '<end_of_turn>\n<start_of_turn>model\n' ) ); SELECT * FROM AI.GENERATE_TEXT( MODEL `bqml_tutorial.gemma_model`, ( SELECT FormatPromptWithChatTemplate( 'Extract the key words from the movie review below: ' || review) AS prompt, * FROM `bigquery-public-data.imdb.reviews` LIMIT 10 ), STRUCT( 0.2 AS temperature, 100 AS max_output_tokens));
Weitere Informationen zur Verwendung von Chatvorlagen mit Gemma finden Sie unter Gemma-Formatierung und Systemanweisungen.
Die Ausgabe sieht in etwa so aus. Nicht generierte Spalten wurden zur besseren Übersichtlichkeit weggelassen:
+----------------------------------------------+-------------------------+-----------------------------+-----+ | result | status | prompt | ... | +----------------------------------------------+-------------------------------------------------------+-----+ | Here are some key words from the | | <start_of_turn>user | | | movie review: * **Romance:** | | Extract the key words from | | | "romantic tryst," "elope" * **Comedy:** | | the movie review below: | | | "Contrived Comedy" * **Burglary:** | | Linda Arvidson (as Jennie) | | | "burglar," "rob," "booty" * **Chase:** | | and Harry Solter (as Frank) | | | "chases," "escape" * **Director:** "D.W. | | are enjoying a romantic | | | Griffith" * **Actors:** "Linda Arvidson,"... | | tryst, when in walks her... | | +----------------------------------------------+-------------------------+-----------------------------+-----+ | Here are some key words from the | | <start_of_turn>user | | | movie review: * **Elderbush Gilch:** The | | Extract the key words from | | | name of the movie being reviewed. * | | the movie review below: | | | **Disappointment:** The reviewer's | | This is the second addition | | | overall feeling about the film. * | | to Frank Baum's personally | | | **Dim-witted:** Describes the story | | produced trilogy of Oz | | | line negatively. * **Moronic, sadistic,... | | films. It's essentially ... | | +----------------------------------------------+-------------------------+-----------------------------+-----+Die Ergebnisse enthalten die folgenden Spalten:
result: generierter Text.status: API-Antwortstatus für die entsprechende Zeile. Wenn der Vorgang erfolgreich war, ist dieser Wert leer.prompt: Eingabeaufforderung für die Sentimentanalyse.- Alle Spalten aus der
bigquery-public-data.imdb.reviews-Tabelle.
Kurzanleitung: Eine Sentimentanalyse durchführen
Mit dem Remote-Modell und der AI.GENERATE_TEXT-Funktion können Sie eine Sentimentanalyse für IMDB-Filmrezensionen durchführen:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Führen Sie im Abfrageeditor die folgende Anweisung aus, um eine Stimmungsanalyse für 10 Filmrezensionen durchzuführen:
-- This function takes your instruction and wraps it with chat template for -- better output quality. -- This is usually the recommended way when using Gemma instruction-tuned models. CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS ( CONCAT( '<start_of_turn>user\n', user_instruction, '<end_of_turn>\n<start_of_turn>model\n' ) ); SELECT * FROM AI.GENERATE_TEXT( MODEL `bqml_tutorial.gemma_model`, ( SELECT FormatPromptWithChatTemplate( 'Analyze the sentiment of the following movie review and classify it as either POSITIVE or NEGATIVE. \nMovie Review: ' || review) AS prompt, * FROM `bigquery-public-data.imdb.reviews` LIMIT 10 ), STRUCT( 0.2 AS temperature, 128 AS max_output_tokens));
Weitere Informationen zur Verwendung von Chatvorlagen mit Gemma finden Sie unter Gemma-Formatierung und Systemanweisungen.
Die Ausgabe sieht in etwa so aus. Nicht generierte Spalten wurden zur besseren Übersichtlichkeit weggelassen:
+-----------------------------+-------------------------+-----------------------------+-----+ | result | status | prompt | ... | +-----------------------------+-------------------------------------------------------+-----+ | **NEGATIVE** | | <start_of_turn>user | | | | | Analyze the sentiment of | | | | | movie review and classify | | | | | it as either POSITIVE or | | | | | NEGATIVE. Movie Review: | | | | | Although Charlie Chaplin | | | | | made some great short | | | | | comedies in the late... | | +-----------------------------+-------------------------+-----------------------------+-----+ | **NEGATIVE** | | <start_of_turn>user | | | | | Analyze the sentiment of | | | | | movie review and classify | | | | | it as either POSITIVE or | | | | | NEGATIVE. Movie Review: | | | | | Opulent sets and sumptuous | | | | | costumes well photographed | | | | | by Theodor Sparkuhl, and... | | +-----------------------------+-------------------------+-----------------------------+-----+Die Ergebnisse enthalten die Spalten, die auch unter Keyword-Extraktion ausführen dokumentiert sind.
Bereitstellung des Modells aufheben
Wenn Sie Ihr Projekt nicht wie empfohlen löschen, müssen Sie das Gemma-Modell in Vertex AI bereitstellen, um weitere Abrechnungen dafür zu vermeiden. BigQuery hebt die Bereitstellung des Modells nach einem bestimmten Zeitraum der Inaktivität (standardmäßig 6,5 Stunden) automatisch auf.
Alternativ können Sie die Bereitstellung des Modells sofort aufheben, indem Sie die ALTER MODEL-Anweisung verwenden, wie im folgenden Beispiel gezeigt:
ALTER MODEL `bqml_tutorial.gemma_model` SET OPTIONS (deploy_model = false);
Weitere Informationen finden Sie unter Automatisches oder sofortiges Entfernen der Bereitstellung von Open-Source-Modellen.
Bereinigen
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.