Generare testo utilizzando un modello aperto Gemma e la funzione AI.GENERATE_TEXT

Questo tutorial mostra come creare un modello remoto basato sul modello Gemma, e come utilizzare questo modello con la AI.GENERATE_TEXT funzione per estrarre le parole chiave ed eseguire l'analisi del sentiment sulle recensioni di film dalla tabella pubblica bigquery-public-data.imdb.reviews.

Autorizzazioni obbligatorie

Per eseguire questo tutorial, devi disporre dei seguenti ruoli Identity and Access Management (IAM):

  • Crea e utilizza set di dati, connessioni e modelli BigQuery: Amministratore BigQuery (roles/bigquery.admin).
  • Concedi le autorizzazioni al account di servizio della connessione: Amministratore IAM progetto (roles/resourcemanager.projectIamAdmin).
  • Esegui il deployment e annulla il deployment dei modelli in Vertex AI: Amministratore Vertex AI (roles/aiplatform.admin).

Questi ruoli predefiniti contengono le autorizzazioni necessarie per eseguire le attività descritte in questo documento. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

  • Crea un set di dati: bigquery.datasets.create
  • Crea, delega e utilizza una connessione: bigquery.connections.*
  • Imposta la connessione predefinita: bigquery.config.*
  • Imposta le autorizzazioni del account di servizio: resourcemanager.projects.getIamPolicy e resourcemanager.projects.setIamPolicy
  • Esegui il deployment e annulla il deployment di un modello Vertex AI:
    • aiplatform.endpoints.deploy
    • aiplatform.endpoints.undeploy
  • Crea un modello ed esegui l'inferenza:
    • bigquery.jobs.create
    • bigquery.models.create
    • bigquery.models.getData
    • bigquery.models.updateData
    • bigquery.models.updateMetadata

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Costi

In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:

  • BigQuery ML: You incur costs for the data that you process in BigQuery.
  • Vertex AI: You incur costs for calls to the Vertex AI model that's represented by the remote model.

Per generare una stima dei costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.

I nuovi Google Cloud utenti potrebbero avere diritto a una prova senza costi.

Per ulteriori informazioni sui prezzi di BigQuery, consulta la pagina Prezzi di BigQuery nella documentazione di BigQuery.

I modelli aperti di cui esegui il deployment su Vertex AI vengono addebitati per ora di macchina. Ciò significa che la fatturazione inizia non appena l'endpoint è completamente configurato e continua fino a quando non annulli il deployment. Per ulteriori informazioni sui prezzi di Vertex AI, consulta la pagina Prezzi di Vertex AI.

Prima di iniziare

  1. Nella Google Cloud console, nella pagina di selezione del progetto, seleziona o crea un Google Cloud progetto.

    Ruoli richiesti per selezionare o creare un progetto

    • Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico: puoi selezionare qualsiasi progetto su cui ti è stato concesso un ruolo.
    • Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l' resourcemanager.projects.create autorizzazione. Scopri come concedere i ruoli.

    Vai al selettore di progetti

  2. Verifica che la fatturazione sia abilitata per il tuo Google Cloud progetto.

  3. Abilita le API BigQuery, BigQuery Connection e Vertex AI.

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (roles/serviceusage.serviceUsageAdmin), che contiene l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    Abilita le API

Crea un set di dati

Crea un set di dati BigQuery per archiviare il tuo modello ML.

Console

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai alla pagina BigQuery

  2. Nel riquadro Spazio di esplorazione, fai clic sul nome del progetto.

  3. Fai clic su Visualizza azioni > Crea set di dati.

  4. Nella pagina Crea set di dati, segui questi passaggi:

    • In ID set di dati, inserisci bqml_tutorial.

    • In Tipo di località, seleziona Multi-regione e poi seleziona Stati Uniti.

    • Lascia invariate le restanti impostazioni predefinite e fai clic su Crea set di dati.

bq

Per creare un nuovo set di dati, utilizza il bq mk --dataset comando.

  1. Crea un set di dati denominato bqml_tutorial con la località dei dati impostata su US.

    bq mk --dataset \
      --location=US \
      --description "BigQuery ML tutorial dataset." \
      bqml_tutorial
  2. Verifica che il set di dati sia stato creato:

    bq ls

API

Chiama il datasets.insert metodo con una risorsa del set di dati definita.

{
  "datasetReference": {
     "datasetId": "bqml_tutorial"
  }
}

Crea il modello remoto

Crea un modello remoto che rappresenti un modello Vertex AI ospitato:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, esegui la seguente istruzione:

CREATE OR REPLACE MODEL `bqml_tutorial.gemma_model`
  REMOTE WITH CONNECTION DEFAULT
  OPTIONS (
    MODEL_GARDEN_MODEL_NAME = 'publishers/google/models/gemma3@gemma-3-270m-it',
    MACHINE_TYPE = 'g2-standard-12'
  );

Il completamento della query richiede fino a 20 minuti, dopodiché il modello gemma_model viene visualizzato nel set di dati bqml_tutorial nel riquadro Spazio di esplorazione. Poiché la query utilizza un'istruzione CREATE MODEL per creare un modello, non vengono visualizzati i risultati della query.

Esegui l'estrazione delle parole chiave

Esegui l'estrazione delle parole chiave dalle recensioni di film di IMDB utilizzando il modello remoto e la funzione AI.GENERATE_TEXT:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, inserisci la seguente istruzione per eseguire l'estrazione delle parole chiave su 10 recensioni di film:

    -- This function takes your instruction and wraps it with chat template for
    -- better output quality.
    -- This is usually the recommended way when using Gemma instruction-tuned models.
    CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS (
      CONCAT(
        '<start_of_turn>user\n',
        user_instruction,
        '<end_of_turn>\n<start_of_turn>model\n'
      )
    );
    
    SELECT
      *
    FROM
      AI.GENERATE_TEXT(
        MODEL `bqml_tutorial.gemma_model`,
        (
          SELECT
            FormatPromptWithChatTemplate(
              'Extract the key words from the movie review below: ' || review)
              AS prompt,
            *
          FROM
            `bigquery-public-data.imdb.reviews`
          LIMIT 10
        ),
        STRUCT(
          0.2 AS temperature,
          100 AS max_output_tokens));

    Per ulteriori informazioni sull'utilizzo dei modelli di chat con Gemma, consulta Formattazione e istruzioni di sistema di Gemma.

    L'output è simile al seguente, con le colonne non generate omesse per chiarezza:

    +----------------------------------------------+-------------------------+-----------------------------+-----+
    | result                                       | status                  | prompt                      | ... |
    +----------------------------------------------+-------------------------------------------------------+-----+
    | Here are some key words from the             |                         | <start_of_turn>user         |     |
    | movie review: * **Romance:**                 |                         | Extract the key words from  |     |
    | "romantic tryst," "elope" * **Comedy:**      |                         | the movie review below:     |     |
    | "Contrived Comedy" * **Burglary:**           |                         | Linda Arvidson (as Jennie)  |     |
    | "burglar," "rob," "booty" * **Chase:**       |                         | and Harry Solter (as Frank) |     |
    | "chases," "escape" * **Director:** "D.W.     |                         | are enjoying a romantic     |     |
    | Griffith" * **Actors:** "Linda Arvidson,"... |                         | tryst, when in walks her... |     |
    +----------------------------------------------+-------------------------+-----------------------------+-----+
    | Here are some key words from the             |                         | <start_of_turn>user         |     |
    | movie review: * **Elderbush Gilch:** The     |                         | Extract the key words from  |     |
    | name of the movie being reviewed. *          |                         | the movie review below:     |     |
    | **Disappointment:** The reviewer's           |                         | This is the second addition |     |
    | overall feeling about the film. *            |                         | to Frank Baum's personally  |     |
    | **Dim-witted:** Describes the story          |                         | produced trilogy of Oz      |     |
    | line negatively. * **Moronic, sadistic,...   |                         | films. It's essentially ... |     |
    +----------------------------------------------+-------------------------+-----------------------------+-----+
    

    I risultati includono le seguenti colonne:

    • result: il testo generato.
    • status: lo stato della risposta dell'API per la riga corrispondente. Se l'operazione è andata a buon fine, questo valore è vuoto.
    • prompt: il prompt utilizzato per l'analisi del sentiment.
    • Tutte le colonne della tabella bigquery-public-data.imdb.reviews.

Esegui l'analisi del sentiment

Esegui l'analisi del sentiment sulle recensioni di film di IMDB utilizzando il modello remoto e la funzione AI.GENERATE_TEXT:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, esegui la seguente istruzione per eseguire l'analisi del sentiment su 10 recensioni di film:

    -- This function takes your instruction and wraps it with chat template for
    -- better output quality.
    -- This is usually the recommended way when using Gemma instruction-tuned models.
    CREATE TEMP FUNCTION FormatPromptWithChatTemplate(user_instruction STRING) AS (
      CONCAT(
        '<start_of_turn>user\n',
        user_instruction,
        '<end_of_turn>\n<start_of_turn>model\n'
      )
    );
    
    SELECT
      *
    FROM
      AI.GENERATE_TEXT(
        MODEL `bqml_tutorial.gemma_model`,
        (
          SELECT
            FormatPromptWithChatTemplate(
              'Analyze the sentiment of the following movie review and classify it as either POSITIVE or NEGATIVE. \nMovie Review: '
              || review) AS prompt,
            *
          FROM
            `bigquery-public-data.imdb.reviews`
          LIMIT 10
        ),
        STRUCT(
          0.2 AS temperature,
          128 AS max_output_tokens));

    Per ulteriori informazioni sull'utilizzo dei modelli di chat con Gemma, consulta Formattazione e istruzioni di sistema di Gemma.

    L'output è simile al seguente, con le colonne non generate omesse per chiarezza:

    +-----------------------------+-------------------------+-----------------------------+-----+
    | result                      | status                  | prompt                      | ... |
    +-----------------------------+-------------------------------------------------------+-----+
    | **NEGATIVE**                |                         | <start_of_turn>user         |     |
    |                             |                         | Analyze the sentiment of    |     |
    |                             |                         | movie review and classify   |     |
    |                             |                         | it as either POSITIVE or    |     |
    |                             |                         | NEGATIVE. Movie Review:     |     |
    |                             |                         | Although Charlie Chaplin    |     |
    |                             |                         | made some great short       |     |
    |                             |                         | comedies in the late...     |     |
    +-----------------------------+-------------------------+-----------------------------+-----+
    | **NEGATIVE**                |                         | <start_of_turn>user         |     |
    |                             |                         | Analyze the sentiment of    |     |
    |                             |                         | movie review and classify   |     |
    |                             |                         | it as either POSITIVE or    |     |
    |                             |                         | NEGATIVE. Movie Review:     |     |
    |                             |                         | Opulent sets and sumptuous  |     |
    |                             |                         | costumes well photographed  |     |
    |                             |                         | by Theodor Sparkuhl, and... |     |
    +-----------------------------+-------------------------+-----------------------------+-----+
    

    I risultati includono le stesse colonne documentate per Esegui l'estrazione delle parole chiave.

Annulla il deployment del modello

Se scegli di non eliminare il progetto come consigliato, devi annullare il deployment del modello Gemma in Vertex AI per evitare la fatturazione continua. BigQuery annulla automaticamente il deployment del modello dopo un periodo di inattività specificato (6,5 ore per impostazione predefinita). In alternativa, puoi annullare immediatamente il deployment del modello utilizzando l' ALTER MODEL istruzione, come mostrato nell'esempio seguente:

ALTER MODEL `bqml_tutorial.gemma_model`
SET OPTIONS (deploy_model = false);

Per ulteriori informazioni, consulta Annullamento del deployment automatico o immediato del modello aperto.

Libera spazio

  1. Nella Google Cloud console, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare e fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.