Caso d'uso dell'AI con agente: automatizzare i workflow di data science

Last reviewed 2025-12-08 UTC

Questo documento descrive un'architettura di alto livello per un'applicazione che esegue un flusso di lavoro di data science per automatizzare attività complesse di analisi dei dati e machine learning.

Questa architettura utilizza set di dati ospitati in BigQuery o AlloyDB per PostgreSQL. L'architettura è un sistema multi-agente che consente agli utenti di eseguire azioni con comandi in linguaggio naturale ed elimina la necessità di scrivere codice SQL o Python complesso.

Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica. Questa architettura consente ai team aziendali e di dati di analizzare le metriche in un'ampia gamma di settori, come vendita al dettaglio, finanza e produzione. Il documento presuppone una conoscenza di base dei sistemi di AI agentica. Per informazioni su come gli agenti differiscono dai sistemi non agentici, consulta Qual è la differenza tra agenti AI, assistenti AI e bot?

La sezione relativa al deployment di questo documento fornisce link a esempi di codice per aiutarti a sperimentare il deployment di un'applicazione di AI agentica che esegue un flusso di lavoro di data science.

Architettura

Il seguente diagramma mostra l'architettura di un agente del flusso di lavoro di data science.

Architettura per un agente del flusso di lavoro di data science.

Questa architettura include i seguenti componenti:

Componente Descrizione
Frontend Gli utenti interagiscono con il sistema multi-agente tramite un frontend, ad esempio un'interfaccia di chat, che viene eseguito come servizio serverless Cloud Run.
Agenti Questa architettura utilizza i seguenti agenti:
  • Agente root: un agente coordinatore che riceve le richieste dal servizio frontend. L'agente root interpreta la richiesta dell'utente e tenta di risolverla autonomamente. Se l'attività richiede strumenti specializzati, l'agente root delega la richiesta all'agente specializzato appropriato.
  • Agente specializzato: l'agente root richiama i seguenti agenti specializzati utilizzando la funzionalità dell'agente come strumento.
    • Agente di analisi: un agente specializzato per l'analisi e la visualizzazione dei dati. L'agente di analisi utilizza il modello di AI per generare ed eseguire codice Python per elaborare set di dati, creare grafici ed eseguire analisi statistiche.
    • Agente AlloyDB per PostgreSQL: un agente specializzato per l'interazione con i dati in AlloyDB per PostgreSQL. L'agente utilizza il modello di AI per interpretare la richiesta dell'utente e generare SQL nel dialetto PostgreSQL. L'agente si connette in modo sicuro a il database utilizzando MCP Toolbox for Databases, quindi esegue la query per recuperare i dati richiesti.
    • Agente BigQuery: un agente specializzato per l'interazione con i dati in BigQuery. L'agente utilizza il modello di AI per interpretare la richiesta dell'utente e generare GoogleSQL query. L'agente si connette al database utilizzando lo strumento BigQuery integrato di Agent Development Kit (ADK), quindi esegue la query per recuperare i dati richiesti.
  • Agente BigQuery ML: un sottoagente dell'agente root dedicato ai flussi di lavoro di machine learning. L'agente interagisce con BigQuery ML per gestire il ciclo di vita end-to-end di ML. L'agente può creare e addestrare modelli, eseguire valutazioni e generare previsioni in base alle richieste degli utenti.
Runtime degli agenti Gli agenti AI in questa architettura vengono sottoposti a deployment come servizi serverless Cloud Run.
ADK ADK fornisce strumenti e un framework per sviluppare, testare ed eseguire il deployment degli agenti. ADK astrae la complessità della creazione degli agenti e consente agli sviluppatori di AI di concentrarsi su la logica e sulle funzionalità dell'agente.
Modello di AI e runtime dei modelli Per il serving di inferenza, gli agenti in questa architettura di esempio utilizzano l'ultimo modello Gemini su Vertex AI.

Prodotti utilizzati

Questa architettura di esempio utilizza i seguenti Google Cloud prodotti e strumenti open source:

  • Cloud Run: una piattaforma di computing serverless che consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
  • Agent Development Kit (ADK): un insieme di strumenti e librerie per sviluppare, testare ed eseguire il deployment di agenti AI.
  • Vertex AI: una piattaforma ML che consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare nelle applicazioni basate sull'AI.
  • Gemini: una famiglia di modelli di AI multimodale sviluppati da Google.
  • BigQuery: un data warehouse aziendale che ti aiuta a gestire e analizzare i tuoi dati con funzionalità integrate come machine learning, analisi geospaziale e business intelligence.
  • AlloyDB per PostgreSQL: un servizio di database completamente gestito e compatibile con PostgreSQL progettato per i carichi di lavoro più impegnativi, tra cui l'elaborazione analitica e transazionale ibrida (HTAP).
  • MCP Toolbox for Databases: un server Model Context Protocol (MCP) open source che consente agli agenti AI di connettersi in modo sicuro ai database gestendo le complessità del database come il pool di connessioni, l'autenticazione e l'osservabilità.

Deployment

Per eseguire il deployment di un'implementazione di esempio di questa architettura, utilizza Data Science with Multiple Agents. Il repository fornisce due set di dati di esempio per dimostrare la flessibilità del sistema, tra cui un set di dati sui voli per l'analisi operativa e un set di dati sulle vendite di e-commerce per l'analisi aziendale.

Passaggi successivi

Collaboratori

Autore: Samantha He | Technical Writer

Altri collaboratori: