Kasus penggunaan AI agentic: Mengotomatiskan alur kerja data science

Dokumen ini menjelaskan arsitektur tingkat tinggi untuk aplikasi yang menjalankan alur kerja ilmu data untuk mengotomatiskan tugas analisis data dan machine learning yang kompleks.

Arsitektur ini menggunakan set data yang dihosting di BigQuery atau AlloyDB untuk PostgreSQL. Arsitekturnya adalah sistem multi-agen yang memungkinkan pengguna menjalankan tindakan dalam perintah bahasa alami dan menghilangkan kebutuhan untuk menulis kode SQL atau Python yang kompleks.

Audiens yang dituju untuk dokumen ini mencakup arsitek, developer, dan administrator yang membangun serta mengelola aplikasi AI agentik. Arsitektur ini memungkinkan tim bisnis dan data menganalisis metrik di berbagai industri, seperti retail, keuangan, dan manufaktur. Dokumen ini mengasumsikan pemahaman dasar tentang sistem AI beragensi. Untuk mengetahui informasi tentang perbedaan agen dengan sistem non-agen, lihat Apa perbedaan antara agen AI, asisten AI, dan bot?

Bagian deployment dalam dokumen ini menyediakan link ke contoh kode untuk membantu Anda bereksperimen dengan men-deploy aplikasi AI agentik yang menjalankan alur kerja data science.

Arsitektur

Diagram berikut menunjukkan arsitektur untuk agen alur kerja ilmu data.

Arsitektur untuk agen alur kerja data science.

Arsitektur ini mencakup komponen berikut:

Komponen Deskripsi
Frontend Pengguna berinteraksi dengan sistem multi-agen melalui frontend, seperti antarmuka chat, yang berjalan sebagai layanan Cloud Run tanpa server.
Agen Arsitektur ini menggunakan agen berikut:
  • Agen root: Agen koordinator yang menerima permintaan dari layanan frontend. Agen root menafsirkan permintaan pengguna dan mencoba menyelesaikan permintaan itu sendiri. Jika tugas memerlukan alat khusus, agen root akan mendelegasikan permintaan ke agen khusus yang sesuai.
  • Agen khusus: Agen root memanggil agen khusus berikut dengan menggunakan fitur agen sebagai alat.
    • Agen analisis: Agen khusus untuk analisis dan visualisasi data. Agen analisis menggunakan model AI untuk membuat dan menjalankan kode Python untuk memproses set data, membuat diagram, dan melakukan analisis statistik.
    • Agen AlloyDB untuk PostgreSQL: Agen khusus untuk berinteraksi dengan data di AlloyDB untuk PostgreSQL. Agen menggunakan model AI untuk menafsirkan permintaan pengguna dan membuat SQL dalam dialek PostgreSQL. Agen terhubung dengan aman ke database menggunakan MCP Toolbox for Databases, lalu menjalankan kueri untuk mengambil data yang diminta.
    • Agen BigQuery: Agen khusus untuk berinteraksi dengan data di BigQuery. Agen menggunakan model AI untuk menafsirkan permintaan pengguna dan membuat kueri GoogleSQL. Agen terhubung ke database menggunakan alat BigQuery bawaan Agent Development Kit (ADK)'s, lalu menjalankan kueri untuk mengambil data yang diminta.
  • Agen BigQuery ML: Subagen dari agen root yang dikhususkan untuk alur kerja machine learning. Agen berinteraksi dengan BigQuery ML untuk mengelola siklus proses ML menyeluruh. Agen dapat membuat dan melatih model, menjalankan evaluasi, dan membuat prediksi berdasarkan permintaan pengguna.
Runtime agen Agen AI dalam arsitektur ini di-deploy sebagai layanan Cloud Run serverless.
ADK ADK menyediakan alat dan framework untuk mengembangkan, menguji, dan men-deploy agen. ADK mengabstraksi kompleksitas pembuatan agen dan memungkinkan developer AI berfokus pada logika dan kemampuan agen.
Model AI dan runtime model Untuk penayangan inferensi, agen dalam contoh arsitektur ini menggunakan model Gemini terbaru di Vertex AI.

Produk yang digunakan

Arsitektur contoh ini menggunakan produk dan alat open source berikut: Google Cloud

  • Cloud Run: Platform komputasi serverless yang memungkinkan Anda menjalankan container langsung di atas infrastruktur Google yang bersifat skalabel.
  • Agent Development Kit (ADK): Kumpulan alat dan library untuk mengembangkan, menguji, dan men-deploy agen AI.
  • Vertex AI: Platform ML yang memungkinkan Anda melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
  • Gemini: Rangkaian model AI multimodal yang dikembangkan oleh Google.
  • BigQuery: Data warehouse perusahaan yang membantu Anda mengelola dan menganalisis data dengan fitur bawaan seperti machine learning, analisis geospasial, dan business intelligence.
  • AlloyDB untuk PostgreSQL: Layanan database yang kompatibel dengan PostgreSQL dan terkelola sepenuhnya yang didesain untuk workload dengan tuntutan tinggi, termasuk pemrosesan transaksional dan analisis hybrid.
  • MCP Toolbox for Databases: Server Model Context Protocol (MCP) open source yang memungkinkan agen AI terhubung secara aman ke database dengan mengelola kompleksitas database seperti penggabungan koneksi, autentikasi, dan kemampuan observasi.

Deployment

Untuk men-deploy contoh implementasi arsitektur ini, gunakan Data Science dengan Beberapa Agen. Repositori ini menyediakan dua set data sampel untuk menunjukkan fleksibilitas sistem, termasuk set data penerbangan untuk analisis operasional dan set data penjualan e-commerce untuk analisis bisnis.

Langkah berikutnya

Kontributor

Penulis: Samantha He | Technical Writer

Kontributor lainnya: