Kasus penggunaan Dataflow

Dataflow dirancang untuk mendukung pipeline streaming dan batch dalam skala besar. Dataflow dibangun di framework Apache Beam open source.

Halaman ini menautkan ke tutorial dan contoh kasus penggunaan untuk membantu Anda memulai.

Tentang Dataflow Tentang Apache Beam

Perpindahan data

Memproses data dari Kafka ke BigQuery

Tutorial ini menunjukkan cara menjalankan template Dataflow yang membaca dari Layanan Terkelola untuk Apache Kafka dan menulis data ke tabel BigQuery.

Memproses data dari Pub/Sub ke BigQuery

Tutorial ini menunjukkan cara menjalankan template Dataflow yang membaca pesan berenkode JSON dari Pub/Sub dan menuliskannya ke tabel BigQuery.

Dataflow ML

Menggunakan RunInference dan Embedding

Notebook ini menunjukkan cara menggunakan model ML di pipeline Apache Beam yang menggunakan transformasi RunInference.

Menggunakan GPU di pipeline Anda

Notebook ini menunjukkan cara menjalankan inferensi machine learning menggunakan vLLM dan GPU. vLLM adalah library untuk inferensi dan penyajian LLM.