Panoramica dell'analisi conversazionale
L'analisi conversazionale in BigQuery ti consente di chattare con gli agenti sui tuoi dati utilizzando il linguaggio naturale Per ottenere risposte sui tuoi dati, puoi:
- Creare agenti di dati che definiscono automaticamente il contesto dei dati e le istruzioni di elaborazione delle query per un insieme di origini di conoscenza, come tabelle, viste, grafici o funzioni definite dall'utente (UDF) che selezioni.
- Se necessario, puoi creare contesto e istruzioni per un agente sotto forma di metadati personalizzati di tabelle e campi, istruzioni all'agente per interpretare ed eseguire query sui dati oppure creando query verificate (precedentemente note come query di riferimento) per configurare l'agente di dati in modo che risponda efficacemente alle domande per casi d'uso specifici.
Prima di personalizzare un agente, ti consigliamo di lavorare prima con il contesto e le istruzioni create dall'agente.
Di seguito sono riportati alcuni esempi di contesto e istruzioni che fornisci all'agente:
- Contesto. Un agente di dati per l'analisi delle vendite può essere configurato in modo da comprendere che "top performer" si riferisce ai rappresentanti di vendita con le entrate più elevate, anziché solo al maggior numero di deal conclusi.
- Istruzioni. Puoi indicare a un agente di dati di filtrare sempre i dati in base al trimestre più recente quando gli viene chiesto dei "trend" o di raggruppare i risultati per "categoria di prodotto" per impostazione predefinita.
Dopo aver creato gli agenti di dati, puoi quindi avere conversazioni con loro per porre domande sui dati di BigQuery utilizzando il linguaggio naturale. Puoi anche creare conversazioni dirette con una o più origini dati per rispondere a domande di base e una tantum.
L'analisi conversazionale è basata su Gemini in Google Cloud e supporta alcune funzioni di AI e ML di BigQuery. Per saperne di più, consulta Supporto di AI e ML di BigQuery.
Scopri come e quando Gemini in Google Cloud utilizza i tuoi dati. Google Cloud
Agenti di dati
Gli agenti di dati sono costituiti da una o più origini di conoscenza e da un insieme di istruzioni specifiche per un caso d'uso per l'elaborazione di questi dati. Quando crei un agente di dati, puoi configurarlo utilizzando le seguenti opzioni:
- Utilizza origini di conoscenza come tabelle, viste e UDF con un agente di dati. Puoi anche connetterti alle tabelle Lakehouse come origini. Per saperne di più, vedi Eseguire query sui dati di Lakehouse con il linguaggio naturale.
- Fornisci metadati personalizzati di tabelle e campi per descrivere i dati nel modo più appropriato per il caso d'uso specifico.
- Fornisci istruzioni per interpretare ed eseguire query sui dati, ad esempio definendo quanto segue:
- Sinonimi e termini aziendali per i nomi dei campi
- Campi e valori predefiniti più importanti per il filtraggio e il raggruppamento
- Crea query verificate che l'agente di dati può utilizzare per definire la struttura della risposta di un agente e per apprendere la logica di business utilizzata dalla tua organizzazione. Le query verificate erano precedentemente note come query di riferimento. Le query verificate possono utilizzare le funzioni di AI e ML di BigQuery supportate e supportano i parametri di query.
- Crea termini del glossario personalizzato di BigQuery per ogni agente o importa i termini del glossario aziendale da Knowledge Catalog. Questi termini aiutano un agente a interpretare i prompt degli utenti. Per indicazioni su quando utilizzare ogni tipo, consulta Creare o esaminare i termini del glossario.
Gestire gli agenti di dati
Puoi creare, gestire e utilizzare i seguenti tipi di agenti di dati nella scheda Catalogo agenti della Google Cloud console:
- Un agente di esempio predefinito per ogni Google Cloud progetto.
- Un elenco degli agenti in bozza, creati e pubblicati.
- Un elenco degli agenti creati e condivisi con te da altre persone.
Per saperne di più, consulta Creare agenti di dati.
Altri servizi del progetto che supportano gli agenti di dati, come l' API Conversational Analytics e Data Studio, possono accedere agli agenti di dati che crei in BigQuery. Puoi anche accedere a un agente creato nella Google Cloud console chiamandolo utilizzando la Conversational Analytics API.
Conversazioni
Le conversazioni sono chat persistenti con un agente di dati o un'origine dati. Puoi porre agli agenti di dati domande in più parti che utilizzano termini comuni come "vendite" o "più popolari", senza dover specificare i nomi dei campi delle tabelle o definire le condizioni per filtrare i dati. Puoi anche porre domande sui dati che si trovano in oggetti come i PDF. Quando crea una risposta, un agente può determinare le origini dati su cui eseguire query e sfruttare le ottimizzazioni, come le partizioni di tabelle o gli indici di ricerca.
La risposta della chat che ti viene restituita offre le seguenti funzionalità:
- La risposta alla tua domanda sotto forma di testo, codice o immagini (multimodale). La risposta può includere le funzioni di AI e ML di BigQuery supportate.
- Grafici generati, se appropriato.
- Il ragionamento dell'agente alla base dei risultati.
- Metadati sulla conversazione, come l'agente e le origini dati utilizzati.
Quando crei una conversazione diretta con un'origine dati, la Conversational Analytics API interpreta la tua domanda senza il contesto e le istruzioni di elaborazione offerte da un agente di dati. Per questo motivo, i risultati delle conversazioni dirette possono essere meno precisi. Utilizza gli agenti di dati per i casi che richiedono una maggiore precisione.
Puoi creare e gestire le conversazioni in BigQuery utilizzando la Google Cloud console. Per saperne di più, consulta Analizzare i dati con le conversazioni.
Supporto di AI e ML di BigQuery
L'analisi conversazionale supporta le seguenti funzioni di AI in risposta alle chat con agenti di dati e origini dati e nelle query SQL verificate che crei.
AI.FORECASTAI.DETECT_ANOMALIESAI.KEY_DRIVERSAI.GENERATEAI.IFAI.SCOREAI.CLASSIFYAI.SIMILARITYAI.SEARCH
Devi disporre delle autorizzazioni necessarie per eseguire query di AI generativa.
L'agente utilizza la funzione AI.SEARCH solo sulle tabelle per cui è abilitata la
generazione di incorporamenti autonomi. In caso contrario, l'agente utilizza la funzione AI.SIMILARITY, che richiede la generazione di incorporamenti in tempo reale.
Casi d'uso
Per attivare le funzioni supportate, utilizzale nei seguenti modi:
- Quando crei un agente e aggiungi una query verificata, ad esempio se sei un data scientist che prepara un report ricorrente, puoi utilizzare le funzioni di AI supportate in una query verificata per descrivere i valori predefiniti e automatizzare il report.
- Quando poni domande di alto livello sui dati a un agente, in una conversazione o in una query verificata utilizzando le parole chiave, l'agente genera SQL in risposta alle tue domande.
La tabella seguente mostra esempi di prompt una tantum che attivano l'utilizzo di funzioni di AI o ML:
| Caso d'uso | Esempi di utilizzo | Set di dati pubblici |
|---|---|---|
| Previsione | "Prevedi il numero di viaggi per il mese successivo." | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| Rilevamento di anomalie | "Trova i valori anomali nei viaggi al giorno per il 2018 utilizzando il 2017 come baseline." | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| Principali fattori determinanti | "Identifica i principali fattori determinanti per le variazioni del volume di viaggi tra il 2017 e il 2018." | bigquery-public-data.austin_bikeshare.bikeshare_trips |
| Generazione di testo LLM | "Per ogni articolo nella categoria 'sport', riassumi la colonna del corpo in 1-2 frasi." | bigquery-public-data.bbc_news.fulltext |
| Filtraggio semantico | "Per gli articoli nella categoria tecnologia, filtra per trovare quelli che parlano di scoperte nell'intelligenza artificiale." | bigquery-public-data.bbc_news.fulltext |
| Punteggio semantico | "Per gli articoli nella categoria intrattenimento, fornisci una valutazione che indichi il loro grado di sentiment positivo." | bigquery-public-data.bbc_news.fulltext |
| Categorizzazione semantica | "Tagga ogni recensione con l'argomento principale del recensore: Recitazione, Trama, Cinematografia, Regia o Altro" | bigquery-public-data.imdb.reviews |
| Ricerca semantica | "Trova le 5 recensioni principali che corrispondono maggiormente a 'thriller psicologico che crea tensione'" | bigquery-public-data.imdb.reviews |
Supporto dei grafici
L'analisi conversazionale supporta l'utilizzo di un grafico come origine dati. Quando poni domande sul grafico, l'agente crea query GQL o SQL per rispondere. Gli agenti possono utilizzare le descrizioni e i sinonimi che definisci nelle etichette e nelle proprietà del grafico per migliorare la qualità dei risultati. Gli agenti possono anche sfruttare le misure definite nel grafico per eseguire l'aggregazione a più livelli. Se la risposta include i percorsi del grafico, vengono fornite le visualizzazioni del grafico.
Ad esempio, puoi utilizzare l'agente di esempio
Look Graph in BigQuery nella
pagina Agenti
per porre domande simili alle seguenti sul grafico
bigquery-public-data.thelook_ecommerce.graph:
Which product is most popular among 25-year-olds?Show me the connection between bow tie orders and distribution centers
Limitazioni
Quando utilizzi un grafico come origine dati, si applicano le seguenti limitazioni:
- Puoi utilizzare al massimo un grafico come origine dati per agente o conversazione.
- Non puoi combinare tabelle e grafici come origini dati.
Sicurezza
Puoi gestire l'accesso all'analisi conversazionale in BigQuery utilizzando i ruoli e le autorizzazioni IAM dell'API Conversational Analytics e le autorizzazioni. Per informazioni sui ruoli necessari per operazioni specifiche, consulta i ruoli richiesti per gli agenti di dati e i ruoli richiesti per le conversazioni.
L'analisi conversazionale include le seguenti funzionalità e misure di sicurezza:
- Può accedere solo ai dati e alle risorse a cui hai l'autorizzazione ad accedere.
- Rispetta i controlli di sicurezza di Controlli di servizio VPC.
- Non può eseguire operazioni di scrittura e non può eseguire query DML.
- Non può eseguire funzioni remote.
- Può accedere solo alle origini di conoscenza che selezioni esplicitamente.
- La cronologia delle conversazioni viene condivisa solo con te. Non puoi condividerla con altri utenti.
- Quando crei un agente di dati, devi avere accesso per eseguire query su ogni origine di conoscenza che aggiungi.
Località
L'analisi conversazionale supporta tre località che regolano l'archiviazione delle risorse di agenti e conversazioni e la località utilizzata per l'elaborazione di ML:
- US MREP
- EU MREP
- Globale
Quando crei agenti e conversazioni, si applicano i seguenti comportamenti predefiniti:
- Se tutte le origini di conoscenza provengono da regioni negli Stati Uniti, viene utilizzato US MREP.
- Se tutte le origini di conoscenza provengono da regioni dell'UE, viene utilizzato EU MREP.
- In caso contrario, viene utilizzata la località globale.
Quando crei un agente, puoi facoltativamente selezionare una località diversa. Dopo aver salvato l'agente, non puoi modificarne la località.
Gli agenti creati prima del 4 giugno 2026 si trovano nella località globale.
Prezzi
Ti viene addebitato il prezzo di calcolo di BigQuery per le query eseguite quando crei agenti di dati e conversi con agenti di dati o origini dati. Per saperne di più, consulta i prezzi degli agenti.
Best practice
Segui queste best practice quando utilizzi l'analisi conversazionale:
Esegui la pulizia dei dati nelle tabelle prima di aggiungerle come origini dati.
Unisci le tabelle correlate in una vista e utilizza questa vista come origine dati, anziché fare affidamento sull'agente per determinare il modo corretto di unire i dati.
Esegui scansioni di profilazione dei dati.
Definisci l'ambito degli agenti. Gli agenti con un ambito ampio possono avere conflitti di istruzioni, output ambigui e prestazioni incoerenti. Se l'agente richiede più di 20 origini dati, viene utilizzato da team con definizioni di metriche diverse o dà la priorità a un tipo di risultato a scapito di un altro, valuta la possibilità di creare agenti aggiuntivi.
Fornisci il contesto all'agente. Dai la priorità ai tipi di contesto nel seguente modo:
- Query verificate. SQL deterministico che viene eseguito quando corrisponde a un prompt dell'utente.
- Glossari. Definizioni dei termini che collegano le colonne al contesto semantico.
- Istruzioni agente. Regole e definizioni di comportamento globali scritte utilizzando il linguaggio naturale, come le definizioni del calendario fiscale o le regole di formattazione.
Aggiungi descrizioni di tabelle e colonne alle tabelle.
Non duplicare le definizioni del glossario in Knowledge Catalog e nel glossario personalizzato di BigQuery.
Imposta limiti di spesa a livello di progetto, utente e query per gestire i costi degli agenti.
Poni domande efficaci nelle conversazioni.
Scopri come funzionano la conservazione e l'eliminazione dei dati per gli agenti di dati e le conversazioni.
Limitazioni
Per saperne di più sulle limitazioni relative a query, conversazioni, dati e visualizzazioni, consulta Limitazioni note dell'API Conversational Analytics.
Quota condivisa dinamica
La quota condivisa dinamica (DSQ) in Gemini Enterprise Agent Platform gestisce la capacità del modello Gemini. A differenza delle quote convenzionali, la DSQ ti consente di accedere a un ampio pool condiviso di risorse senza un limite fisso per progetto per la velocità effettiva del modello.
Il rendimento, ad esempio la latenza, può variare a seconda del carico complessivo del sistema. Durante i periodi di elevata domanda nel pool condiviso, potresti occasionalmente riscontrare errori temporanei 429 Resource Exhausted. Questi errori indicano che la capacità del pool condiviso è momentaneamente limitata, ma non che hai raggiunto un limite di quota specifico per il tuo progetto. Per verificare la capacità, riprova a inviare la richiesta dopo un breve ritardo.
Identificare e analizzare le query generate dagli agenti
I job di BigQuery eseguiti da un agente di dati includono etichette specifiche. Queste etichette ti consentono di identificare, filtrare e analizzare i job dell'agente.
Puoi utilizzare queste etichette per le seguenti attività:
- Filtra il report sulla fatturazione per etichetta per comprendere i costi degli agenti.
- Controlla l'attività degli agenti.
- Analizza le prestazioni delle query.
Identificare le etichette degli agenti di dati nella Google Cloud console
BigQuery applica etichette ai job eseguiti da un agente di dati. Per ottenere la chiave di etichetta per il filtraggio e altre analisi, visualizza la chiave di etichetta nellaGoogle Cloud console.
Per visualizzare la chiave di etichetta di un agente di dati:
Nella Google Cloud console, visualizza i dettagli del job.
Nel riquadro Dettagli job di query, individua la sezione Etichette e cerca le etichette con il prefisso
ca, ad esempioca-bq-job: true.
Analizzare i job generati dagli agenti
Utilizza l'etichetta per analizzare i job generati dagli agenti. Ad esempio, per verificare il numero di job eseguiti da un agente di dati, esegui la seguente query sulla
INFORMATION_SCHEMA.JOBS vista:
SELECT
COUNT(*) AS job_count
FROM
`PROJECT_ID`.`region-REGION`.INFORMATION_SCHEMA.JOBS
WHERE
EXISTS (
SELECT 1
FROM UNNEST(labels) AS label
WHERE label.key = 'ca-bq-job' AND label.value = 'true'
);
Sostituisci quanto segue:
PROJECT_ID: l'ID del tuo Google Cloud progetto.REGION: la regione in cui vengono eseguiti i job (ad esempio,usoeu).
Passaggi successivi
- Scopri di più sull'API Conversational Analytics.
- Crea agenti di dati.
- Analizza i dati con le conversazioni.
- Utilizza l'analisi conversazionale con Lakehouse
- Scopri come filtrare le risorse utilizzando le etichette.