Utilizzare Gemini Cloud Assist

Questo documento descrive come utilizzare Gemini Cloud Assist, un prodotto di Gemini for Google Cloud portfolio, per comprendere e utilizzare i metadati, i job e le query in BigQuery. Fornisce i casi d'uso supportati e i prompt di esempio che puoi utilizzare in Gemini Cloud Assist.

Prima di iniziare

Prima di poter utilizzare Gemini Cloud Assist, l'amministratore deve eseguire i passaggi per configurare Gemini Cloud Assist per il progetto o la cartella in cui stai lavorando.

Per supportare le domande e le richieste relative alle tue Google Cloud risorse, Gemini Cloud Assist ha bisogno delle autorizzazioni Identity and Access Management (IAM) appropriate per queste risorse. Gemini Cloud Assist eredita le tue autorizzazioni quando gli chiedi di eseguire query sui dati BigQuery, quindi in molti casi le autorizzazioni IAM necessarie sono già concesse. Per saperne di più, consulta Requisiti IAM per l'utilizzo di Gemini Cloud Assist.

Utilizzare Gemini Cloud Assist

  1. Vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nella Google Cloud barra degli strumenti, fai clic su spark Apri o chiudi la chat dell'AI di Gemini per aprire la chat di Gemini Cloud Assist.

    Pulsante Gemini Cloud Assist nella barra degli strumenti di BigQuery.

  3. Nel campo Inserisci un prompt, inserisci il prompt.

  4. Fai clic su Invia Invia.

Le sezioni seguenti forniscono esempi di attività che puoi eseguire con Gemini Cloud Assist, insieme a prompt di esempio.

Scoprire le risorse

Cerca e scopri le risorse di set di dati e tabelle in un singolo progetto o in più progetti. Gemini Cloud Assist utilizza Knowledge Catalog per cercare le risorse BigQuery. Le ricerche vengono eseguite utilizzando le tue autorizzazioni. Ad esempio, se non hai l'autorizzazione per visualizzare i metadati di una risorsa, questa non verrà visualizzata nei risultati. I casi d'uso supportati includono:

  • Cerca una risorsa per nome. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    Ho set di dati denominati ecommerce?

  • Chiedi informazioni sui metadati di una tabella. Puoi chiedere informazioni su una tabella per nome o lasciare che Gemini Cloud Assist deduca la tabella che intendi in base alla cronologia della chat o alla tabella a cui viene fatto riferimento nella scheda della query attiva. Se specifichi una tabella per nome, devi utilizzare il nome completo. Puoi chiedere informazioni sullo schema di una tabella o su altri metadati, come il partizionamento e il clustering. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    Qual è lo schema di PROJECT_NAME.DATASET_NAME.TABLE_NAME?

  • Chiedi dove trovare informazioni specifiche. Nel riquadro Cloud Assist , inserisci un prompt simile al seguente:

    Dove posso trovare dati demografici, come età e località, per i nuovi utenti dell'ultimo anno?

Generare codice

Puoi utilizzare Gemini Cloud Assist per generare codice SQL e Python per eseguire query e analizzare i dati.

Generare SQL

Genera una query SQL descrivendo cosa vuoi che faccia la query. Per risultati ottimali, includi il nome della tabella su cui vuoi eseguire la query. Ad esempio, nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

Genera una query SQL per mostrarmi la durata e il tipo di abbonato per i dieci viaggi più lunghi. Utilizza la bigquery-public-data.san_francisco_bikeshare.bikeshare_trips tabella.

Generare codice Python

Genera codice Python descrivendo cosa vuoi che faccia. Ad esempio, nel riquadro Cloud Assist, puoi inserire il seguente prompt per chiedere a Gemini di eseguire query sulla tabella penguins di un set di dati pubblico utilizzando la sintassi dei comandi magici di BigQuery:

Genera codice Python per eseguire query sulla tabella bigquery-public-data.ml_datasets.penguins utilizzando i comandi magici di BigQuery.

Pianificare una query

Pianifica una query fornendo i seguenti dettagli nel prompt:

  • Pianificazione, ad esempio ogni lunedì alle 17:00 o ogni due martedì alle 2:00
  • Nome visualizzato
  • ID tabella di destinazione e ID set di dati di destinazione
  • Ora di inizio
  • Ora di fine
  • Istruzione di scrittura, ad esempio WRITE_EMPTY, WRITE_APPEND o WRITE_TRUNCATE

Ad esempio, nel riquadro Cloud Assist, puoi inserire un prompt simile al seguente:

Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.

Trace la derivazione dei dati

Puoi utilizzare Gemini Cloud Assist per esplorare e analizzare la tracciabilità dei dati. Può aiutarti a comprendere le dipendenze dei dati, valutare l'impatto delle modifiche strutturali e riassumere i flussi di dati complessi. Per analizzare la tracciabilità, puoi chiedere a Gemini Cloud Assist domande nelle seguenti aree funzionali:

  • Visualizza le statistiche di tracciabilità. Chiedi a Gemini Cloud Assist dati quantitativi su un grafico di derivazione, ad esempio il numero totale di asset, set di dati o progetti coinvolti. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Quanti asset upstream ha Customer_Master?
    • Quanti set di dati BigQuery sono coinvolti nella tracciabilità upstream di Customer_Interaction_Summary?
    • Fornisci un conteggio di tutti gli asset univoci nel grafico upstream di Marketing_Interaction.
  • Analizza le dipendenze immediate. Identifica i genitori diretti (origini) o i figli diretti (consumer) di un asset specifico analizzando le relazioni di un hop. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Quali sono le origini immediate di Customer_Master?
    • Quali sono i consumer diretti della tabella Card_Master?
    • Quali sono le origini dirette di Web_Session_Validated?
  • Valuta l'impatto downstream. Comprendi le conseguenze downstream della modifica o dell'eliminazione di un asset. Puoi definire l'ambito di questi prompt in base alla profondità (numero di hop) o ai limiti di progetti specifici. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Quali asset sono interessati se elimino Customer_Master?
    • Mostrami gli asset downstream di Customer_Master entro 2 hop.
    • La modifica di Customer_Master influirà sugli asset del progetto "data-lineage-manual-tests"?
  • Identifica le origini principali e le destinazioni finali. Trova le origini finali o le destinazioni terminali dei tuoi dati, ignorando i passaggi di trasformazione intermedi. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Quali sono tutte le origini finali dei dati per Customer_Master?
    • Quali sono le origini dati originali per Transaction_Data_Enriched, escluse le tabelle intermedie?
    • Quali sono le destinazioni finali dei dati di Card_Data_Validated?
  • Traccia il flusso di dati tra gli asset. Chiedi a Gemini Cloud Assist di spiegare la connessione, il percorso o il flusso di dati specifico tra due asset noti. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • In che modo Customer_Master dipende da Customer_Data_Raw?
    • Come fluisce il flusso di dati da Customer_Data_Raw a Customer_Profile_Snapshot?
    • Quanti hop ci sono tra Customer_Data_Raw e Alert_Fact?
  • Filtra la tracciabilità per tipo o nome dell'asset. Cerca tipi specifici di asset connessi (ad esempio visualizzazioni BigQuery o dashboard Looker) o asset che corrispondono a un pattern di denominazione specifico. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Customer_Master viene utilizzato in visualizzazioni BigQuery?
    • Esistono dashboard Looker downstream di Customer_Master?
    • Quali tabelle upstream di Customer_Master hanno 'Country' nel nome?
  • Riassumi i grafici di derivazione. Richiedi una panoramica in linguaggio naturale della tracciabilità di un asset anziché un elenco o un conteggio specifico. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    • Forniscimi un riepilogo degli asset che dipendono da Web_Session_Validated.
    • Riassumi la tracciabilità downstream di questa tabella.
    • Qual è la tracciabilità di bigquery:PROJECT_NAME.DATASET_NAME

Analizzare i job

Scopri di più sui job eseguiti nel tuo progetto, inclusa la cronologia dei job personali e la cronologia dei job del progetto, per supportare i seguenti casi d'uso:

  • Esegui il debug delle query a lunga esecuzione. Scopri lo stato attuale di un job e i motivi per cui potrebbe richiedere più tempo del previsto, ad esempio contesa degli slot, un numero elevato di righe sottoposte a scansione, un volume di dati elevato e altro ancora. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    Perché questo job richiede così tanto tempo? JOB_ID

  • Analizza la causa di un job non riuscito. Scopri perché una query specifica non è riuscita. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    Perché JOB_ID non è riuscito?

  • Trova le query che utilizzano molte risorse. Scopri le query più costose in base al numero stimato di byte elaborati. Nel riquadro Cloud Assist, inserisci un prompt simile al seguente:

    Quali sono le 3 query più costose che ho eseguito negli ultimi 2 giorni?

Amministrare BigQuery

Nell'explorer dei job, puoi chattare con Gemini Cloud Assist per monitorare il rendimento, analizzare la capacità e ottimizzare i costi. Ad esempio, puoi utilizzare Gemini Cloud Assist per le seguenti attività:

  • Analizza le prenotazioni e la capacità. Monitora l'utilizzo del calcolo e identifica i colli di bottiglia utilizzando il linguaggio naturale. Nel riquadro Cloud Assist, puoi inserire prompt simili ai seguenti:

    • Analizza il rendimento delle mie prenotazioni nelle ultime 24 ore.
    • Mostra i progetti e gli utenti principali che utilizzano la mia prenotazione "production".
    • La mia capacità attuale è sufficiente per il carico di picco?
  • Monitora e confronta i job. Confronta i workload per comprendere le variazioni di rendimento. Puoi ottenere un riepilogo del rendimento dei job che evidenzia i colli di bottiglia e le opportunità di ottimizzazione oppure confrontare direttamente i dettagli di esecuzione di job diversi per identificare regressioni o miglioramenti.

  • Configurazione della gestione dei workload. Esamina e gestisci le impostazioni di prenotazione di BigQuery, inclusi incarichi e impegni, utilizzando il linguaggio naturale. Questa funzionalità fornisce visibilità sulle configurazioni di scalabilità automatica, sulla gestione degli slot inattivi e sui dettagli specifici della versione. Nel riquadro Cloud Assist, puoi inserire prompt simili ai seguenti:

    • Elenca le mie prenotazioni con scalabilità automatica.
    • Recupera i miei incarichi per PROJECT_ID.
    • Qual è la configurazione della mia prenotazione RESERVATION_NAME?
    • Elenca i miei impegni.
    • Quante prenotazioni hanno configurato l'opzione per ignorare gli slot inattivi?
    • Elenca tutte le prenotazioni per versione Enterprise.
    • Elenca tutte le prenotazioni attuali e mostra slot_capacity e autoscale_max_slots per ognuna.
  • Identificazione delle risorse principali. Identifica i consumer principali delle risorse BigQuery. L'assistente può mostrare i job e gli utenti principali in base all'utilizzo degli slot all'interno di progetti o prenotazioni specifici. Questa assistenza fornisce un supporto amministrativo completo per le risorse BigQuery critiche, inclusi job, utenti, progetti e prenotazioni. Analizzando le metriche di rendimento chiave, come l'utilizzo degli slot e la durata dei job, l'assistente fornisce approfondimenti utili per semplificare il monitoraggio e ottimizzare l'allocazione delle risorse. Nel riquadro Cloud Assist , puoi inserire prompt simili ai seguenti:

    • Quali sono gli utenti principali con il maggior utilizzo di slot nel mio progetto?
    • Mostrami i job principali che utilizzano il maggior numero di slot nella prenotazione RESERVATION_NAME nell'ultima ora.

Passaggi successivi