Text mit einem offenen Gemma-Modell und der Funktion AI.GENERATE_TEXT generieren

In dieser Anleitung erfahren Sie, wie Sie ein Remote-Modell erstellen, das auf dem Gemma-Modellbasiert. Anschließend verwenden Sie dieses Modell mit der AI.GENERATE_TEXT Funktion, um Keywords zu extrahieren und eine Sentimentanalyse für Filmrezensionen aus der bigquery-public-data.imdb.reviews öffentlichen Tabelle durchzuführen.

Erforderliche Berechtigungen

Zum Ausführen dieser Anleitung benötigen Sie die folgenden IAM-Rollen (Identity and Access Management):

  • BigQuery-Datasets, -Verbindungen und -Modelle erstellen und verwenden: BigQuery-Administrator (roles/bigquery.admin)
  • Dem Dienstkonto der Verbindung Berechtigungen gewähren: Projekt-IAM-Administrator (roles/resourcemanager.projectIamAdmin)
  • Modelle in Vertex AI bereitstellen und die Bereitstellung aufheben: Vertex AI-Administrator (roles/aiplatform.admin)

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Ausführen der Aufgaben in diesem Dokument erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

  • Dataset erstellen: bigquery.datasets.create
  • Verbindung erstellen, delegieren und verwenden: bigquery.connections.*
  • Standardverbindung festlegen: bigquery.config.*
  • Berechtigungen für Dienstkonten festlegen: resourcemanager.projects.getIamPolicy und resourcemanager.projects.setIamPolicy
  • Vertex AI-Modell bereitstellen und Bereitstellung aufheben:
    • aiplatform.endpoints.deploy
    • aiplatform.endpoints.undeploy
  • Modell erstellen und Inferenz ausführen:
    • bigquery.jobs.create
    • bigquery.models.create
    • bigquery.models.getData
    • bigquery.models.updateData
    • bigquery.models.updateMetadata

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Kosten

In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Google Cloud:

  • BigQuery ML: You incur costs for the data that you process in BigQuery.
  • Vertex AI: You incur costs for calls to the Vertex AI model that's represented by the remote model.

Mit dem Preisrechner können Sie eine Kostenschätzung für Ihre voraussichtliche Nutzung vornehmen. Verwenden Sie den Preisrechner.

Neuen Google Cloud Nutzern vonsteht möglicherweise eine kostenlose Testversion zur Verfügung.

Weitere Informationen zu den Preisen von BigQuery finden Sie unter BigQuery: Preise in der BigQuery-Dokumentation.

Für offene Modelle, die Sie in Vertex AI bereitstellen, werden Kosten pro Maschinenstunde berechnet. Die Abrechnung beginnt, sobald der Endpunkt vollständig eingerichtet ist, und wird fortgesetzt, bis Sie die Bereitstellung aufheben. Weitere Informationen zu den Preisen für Vertex AI finden Sie auf der Seite Vertex AI: Preise.

Hinweis

  1. Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl ein Projekt vonaus oder erstellen Sie eines Google Cloud .

    Erforderliche Rollen zum Auswählen oder Erstellen eines Projekts

    • Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können ein beliebiges Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
    • Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (roles/resourcemanager.projectCreator), die die resourcemanager.projects.create Berechtigung enthält. Informationen zum Zuweisen von Rollen.

    Zur Projektauswahl

  2. Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.

  3. Aktivieren Sie die BigQuery API, die BigQuery Connection API und die Vertex AI API.

    Erforderliche Rollen zum Aktivieren von APIs

    Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Informationen zum Zuweisen von Rollen.

    APIs aktivieren

Dataset erstellen

Erstellen Sie ein BigQuery-Dataset, um Ihr ML-Modell zu speichern.

Console

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    Zur Seite "BigQuery"

  2. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.

  3. Klicken Sie auf Aktionen ansehen > Dataset erstellen.

  4. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:

    • Geben Sie unter Dataset-ID bqml_tutorial ein.

    • Wählen Sie als Standorttyp die Option Multiregional und dann USA aus.

    • Übernehmen Sie die verbleibenden Standardeinstellungen unverändert und klicken Sie auf Dataset erstellen.

bq

Verwenden Sie den bq mk --dataset Befehl, um ein neues Dataset zu erstellen.

  1. Erstellen Sie ein Dataset mit dem Namen bqml_tutorial und legen Sie den Datenstandort auf US fest.

    bq mk --dataset \
      --location=US \
      --description "BigQuery ML tutorial dataset." \
      bqml_tutorial
  2. Prüfen Sie, ob das Dataset erstellt wurde:

    bq ls

API

Rufen Sie die datasets.insert Methode mit einer definierten Dataset-Ressource auf.

{
  "datasetReference": {
     "datasetId": "bqml_tutorial"
  }
}

Remote-Modell erstellen

Erstellen Sie ein Remote-Modell, das ein gehostetes Vertex AI-Modell darstellt:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Führen Sie im Abfrageeditor folgende Abfrage aus:

CREATE OR REPLACE MODEL `bqml_tutorial.gemma_model`
  REMOTE WITH CONNECTION DEFAULT
  OPTIONS (
    MODEL_GARDEN_MODEL_NAME = 'publishers/google/models/gemma3@gemma-3-270m-it',
    MACHINE_TYPE = 'g2-standard-12'
  );

Es kann bis zu 20 Minuten dauern, bis die Abfrage abgeschlossen ist. Anschließend wird das Modell gemma_model im Dataset bqml_tutorial des Bereichs Explorer angezeigt. Da die Abfrage eine CREATE MODEL-Anweisung zum Erstellen eines Modells verwendet, gibt es keine Abfrageergebnisse.

Keyword-Extraktion ausführen

Mit dem Remote-Modell und der Funktion AI.GENERATE_TEXT können Sie eine Keyword-Extraktion für IMDB Filmrezensionen durch führen:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Geben Sie im Abfrageeditor folgende Anweisung ein, um eine Keyword-Extraktion für 10 Filmrezensionen durchzuführen:

    -- This function takes your instruction and wraps it with chat template for
    -- better output quality.
    -- This is usually the recommended way when using Gemma instruction-tuned models.
    CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS (
      CONCAT(
        '<start_of_turn>user\n',
        user_instruction,
        '<end_of_turn>\n<start_of_turn>model\n'
      )
    );
    
    SELECT
      *
    FROM
      AI.GENERATE_TEXT(
        MODEL `bqml_tutorial.gemma_model`,
        (
          SELECT
            FormatPromptWithChatTemplate(
              'Extract the key words from the movie review below: ' || review)
              AS prompt,
            *
          FROM
            `bigquery-public-data.imdb.reviews`
          LIMIT 10
        ),
        STRUCT(
          0.2 AS temperature,
          100 AS max_output_tokens));

    Weitere Informationen zur Verwendung von Chatvorlagen mit Gemma finden Sie unter Gemma-Formatierung und Systemanweisungen.

    Die Ausgabe sieht in etwa so aus. Nicht generierte Spalten wurden zur besseren Übersichtlichkeit weggelassen:

    +----------------------------------------------+-------------------------+-----------------------------+-----+
    | result                                       | status                  | prompt                      | ... |
    +----------------------------------------------+-------------------------------------------------------+-----+
    | Here are some key words from the             |                         | <start_of_turn>user         |     |
    | movie review: * **Romance:**                 |                         | Extract the key words from  |     |
    | "romantic tryst," "elope" * **Comedy:**      |                         | the movie review below:     |     |
    | "Contrived Comedy" * **Burglary:**           |                         | Linda Arvidson (as Jennie)  |     |
    | "burglar," "rob," "booty" * **Chase:**       |                         | and Harry Solter (as Frank) |     |
    | "chases," "escape" * **Director:** "D.W.     |                         | are enjoying a romantic     |     |
    | Griffith" * **Actors:** "Linda Arvidson,"... |                         | tryst, when in walks her... |     |
    +----------------------------------------------+-------------------------+-----------------------------+-----+
    | Here are some key words from the             |                         | <start_of_turn>user         |     |
    | movie review: * **Elderbush Gilch:** The     |                         | Extract the key words from  |     |
    | name of the movie being reviewed. *          |                         | the movie review below:     |     |
    | **Disappointment:** The reviewer's           |                         | This is the second addition |     |
    | overall feeling about the film. *            |                         | to Frank Baum's personally  |     |
    | **Dim-witted:** Describes the story          |                         | produced trilogy of Oz      |     |
    | line negatively. * **Moronic, sadistic,...   |                         | films. It's essentially ... |     |
    +----------------------------------------------+-------------------------+-----------------------------+-----+
    

    Die Ergebnisse enthalten die folgenden Spalten:

    • result: generierter Text.
    • status: API-Antwortstatus für die entsprechende Zeile. Wenn der Vorgang erfolgreich war, ist dieser Wert leer.
    • prompt: Eingabeaufforderung für die Sentimentanalyse.
    • Alle Spalten aus der Tabelle bigquery-public-data.imdb.reviews.

Kurzanleitung: Eine Sentimentanalyse durchführen

Mit dem Remote-Modell und der Funktion AI.GENERATE_TEXT können Sie eine Sentimentanalyse für IMDB Filmrezensionen durch führen:

  1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Führen Sie im Abfrageeditor folgende Abfrage aus, um eine Sentimentanalyse für 10 Filmrezensionen durchzuführen:

    -- This function takes your instruction and wraps it with chat template for
    -- better output quality.
    -- This is usually the recommended way when using Gemma instruction-tuned models.
    CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS (
      CONCAT(
        '<start_of_turn>user\n',
        user_instruction,
        '<end_of_turn>\n<start_of_turn>model\n'
      )
    );
    
    SELECT
      *
    FROM
      AI.GENERATE_TEXT(
        MODEL `bqml_tutorial.gemma_model`,
        (
          SELECT
            FormatPromptWithChatTemplate(
              'Analyze the sentiment of the following movie review and classify it as either POSITIVE or NEGATIVE. \nMovie Review: '
              || review) AS prompt,
            *
          FROM
            `bigquery-public-data.imdb.reviews`
          LIMIT 10
        ),
        STRUCT(
          0.2 AS temperature,
          128 AS max_output_tokens));

    Weitere Informationen zur Verwendung von Chatvorlagen mit Gemma finden Sie unter Gemma-Formatierung und Systemanweisungen.

    Die Ausgabe sieht in etwa so aus. Nicht generierte Spalten wurden zur besseren Übersichtlichkeit weggelassen:

    +-----------------------------+-------------------------+-----------------------------+-----+
    | result                      | status                  | prompt                      | ... |
    +-----------------------------+-------------------------------------------------------+-----+
    | **NEGATIVE**                |                         | <start_of_turn>user         |     |
    |                             |                         | Analyze the sentiment of    |     |
    |                             |                         | movie review and classify   |     |
    |                             |                         | it as either POSITIVE or    |     |
    |                             |                         | NEGATIVE. Movie Review:     |     |
    |                             |                         | Although Charlie Chaplin    |     |
    |                             |                         | made some great short       |     |
    |                             |                         | comedies in the late...     |     |
    +-----------------------------+-------------------------+-----------------------------+-----+
    | **NEGATIVE**                |                         | <start_of_turn>user         |     |
    |                             |                         | Analyze the sentiment of    |     |
    |                             |                         | movie review and classify   |     |
    |                             |                         | it as either POSITIVE or    |     |
    |                             |                         | NEGATIVE. Movie Review:     |     |
    |                             |                         | Opulent sets and sumptuous  |     |
    |                             |                         | costumes well photographed  |     |
    |                             |                         | by Theodor Sparkuhl, and... |     |
    +-----------------------------+-------------------------+-----------------------------+-----+
    

    Die Ergebnisse enthalten die Spalten, die auch unter Keyword-Extraktion ausführen dokumentiert sind.

Bereitstellung des Modells aufheben

Wenn Sie Ihr Projekt nicht wie empfohlen löschen, müssen Sie die Bereitstellung des Gemma-Modells in Vertex AI aufheben, um weitere Abrechnungen zu vermeiden. BigQuery hebt die Bereitstellung des Modells nach einem bestimmten Zeitraum der Inaktivität automatisch auf (standardmäßig 6,5 Stunden). Alternativ können Sie die Bereitstellung des Modells sofort aufheben. Verwenden Sie dazu die ALTER MODEL Anweisung, wie im folgenden Beispiel gezeigt:

ALTER MODEL `bqml_tutorial.gemma_model`
SET OPTIONS (deploy_model = false);

Weitere Informationen finden Sie unter Automatische oder sofortige Aufhebung der Bereitstellung eines offenen Modells.

Bereinigen

  1. Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.