Caso d'uso dell'AI con agente: automatizzare i workflow di data science

Questo documento descrive un'architettura di alto livello per un'applicazione che esegue un flusso di lavoro di data science per automatizzare analisi dei dati complesse e attività di machine learning.

Questa architettura utilizza set di dati ospitati in BigQuery o AlloyDB per PostgreSQL. L'architettura è un sistema multi-agente che consente agli utenti di eseguire azioni in comandi in linguaggio naturale ed elimina la necessità di scrivere codice SQL o Python complesso.

Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica. Questa architettura consente ai team aziendali e di dati di analizzare le metriche in un'ampia gamma di settori, come vendita al dettaglio, finanza e produzione. Il documento presuppone una conoscenza di base dei sistemi di AI agentica. Per informazioni su come gli agenti si differenziano dai sistemi non agentici, consulta Qual è la differenza tra agenti AI, assistenti AI e bot?

La sezione Deployment di questo documento fornisce link a esempi di codice per aiutarti a sperimentare il deployment di un'applicazione di AI con agenti che esegue un flusso di lavoro di data science.

Architettura

Il seguente diagramma mostra l'architettura di un agente del flusso di lavoro di data science.

Architettura per un agente del flusso di lavoro di data science.

Questa architettura include i seguenti componenti:

Componente Descrizione
Frontend Gli utenti interagiscono con il sistema multi-agente tramite un frontend, ad esempio un'interfaccia di chat, che viene eseguita come servizio Cloud Run serverless.
Agenti Questa architettura utilizza i seguenti agenti:
  • Agente root: un agente coordinatore che riceve richieste dal servizio frontend. L'agente principale interpreta la richiesta dell'utente e tenta di risolverla autonomamente. Se l'attività richiede strumenti specializzati, l'agente principale delega la richiesta all'agente specializzato appropriato.
  • Agente specializzato: l'agente radice richiama i seguenti agenti specializzati utilizzando la funzionalità agente come strumento.
    • Agente Analytics: un agente specializzato per l'analisi e la visualizzazione dei dati. L'agente di analisi utilizza il modello di AI per generare ed eseguire codice Python per elaborare set di dati, creare grafici ed eseguire analisi statistiche.
    • Agente AlloyDB per PostgreSQL: un agente specializzato per interagire con i dati in AlloyDB per PostgreSQL. L'agente utilizza il modello di AI per interpretare la richiesta dell'utente e per generare SQL nel dialetto PostgreSQL. L'agente si connette in modo sicuro al database utilizzando MCP Toolbox for Databases, quindi esegue la query per recuperare i dati richiesti.
    • Agente BigQuery: un agente specializzato per interagire con i dati in BigQuery. L'agente utilizza il modello di AI per interpretare la richiesta dell'utente e generare query GoogleSQL. L'agente si connette al database utilizzando lo strumento BigQuery integrato di Agent Development Kit (ADK) ed esegue la query per recuperare i dati richiesti.
  • Agente BigQuery ML: un agente secondario dell'agente root dedicato ai flussi di lavoro di machine learning. L'agente interagisce con BigQuery ML per gestire il ciclo di vita ML end-to-end. L'agente può creare e addestrare modelli, eseguire valutazioni e generare previsioni in base alle richieste degli utenti.
Runtime degli agenti Gli agenti di AI in questa architettura vengono implementati come servizi Cloud Run serverless.
ADK ADK fornisce strumenti e un framework per sviluppare, testare ed eseguire il deployment di agenti. ADK astrae la complessità della creazione di agenti e consente agli sviluppatori di AI di concentrarsi sulla logica e sulle funzionalità dell'agente.
Modello AI e runtime del modello Per la pubblicazione delle inferenze, gli agenti in questa architettura di esempio utilizzano l'ultimo modello Gemini su Vertex AI.

Prodotti utilizzati

Questa architettura di esempio utilizza i seguenti prodotti e strumenti Google Cloud e open source:

  • Cloud Run: una piattaforma di computing serverless che ti consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
  • Agent Development Kit (ADK): un insieme di strumenti e librerie per sviluppare, testare e distribuire agenti AI.
  • Vertex AI: una piattaforma ML che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare in applicazioni basate sull'AI.
  • Gemini: una famiglia di modelli di AI multimodale sviluppati da Google.
  • BigQuery: un data warehouse aziendale che ti aiuta a gestire e analizzare i dati con funzionalità integrate come machine learning, analisi geospaziale e business intelligence.
  • AlloyDB per PostgreSQL: un servizio di database completamente gestito e compatibile con PostgreSQL progettato per i carichi di lavoro più impegnativi, tra cui l'elaborazione analitica e transazionale ibrida.
  • MCP Toolbox for Databases: un server Model Context Protocol (MCP) open source che consente agli agenti AI di connettersi in modo sicuro ai database gestendo le complessità del database come il pooling delle connessioni, l'autenticazione e l'osservabilità.

Deployment

Per eseguire il deployment di un'implementazione di esempio di questa architettura, utilizza Data Science con più agenti. Il repository fornisce due set di dati di esempio per dimostrare la flessibilità del sistema, tra cui un set di dati sui voli per l'analisi operativa e un set di dati sulle vendite di e-commerce per l'analisi aziendale.

Passaggi successivi

Collaboratori

Autore: Samantha He | Technical Writer

Altri collaboratori: