Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Notebook ML Dataflow

Jelajahi notebook Dataflow ML untuk mengintegrasikan machine learning ke dalam pipeline Apache Beam. Notebook ini memberikan contoh praktis dan panduan untuk alur kerja machine learning umum.

Gunakan referensi ini untuk:

Melakukan pra-pemrosesan data untuk model ML: Hal ini mencakup tugas seperti penskalaan data, penghitungan kosakata, dan penggunaan MLTransform untuk persiapan data.
Menjalankan inferensi dengan berbagai model dan framework: Gunakan RunInference transformasi dengan PyTorch, TensorFlow, scikit-learn, model Hugging Face, model Gemma, dan Platform Agen Gemini Enterprise, termasuk di GPU dengan vLLM.
Membuat dan mengelola embedding: Buat teks embedding menggunakan Platform Agen atau Hugging Face, dan masukkan ke dalam database seperti AlloyDB dan BigQuery untuk penelusuran vektor.
Menerapkan pola pipeline ML lanjutan: Hal ini mencakup pembaruan model otomatis dalam pipeline yang berjalan, penggunaan beberapa model, pembuatan model ensemble model, dan pengayaan data menggunakan BigQuery, Bigtable, dan Vertex AI Feature Store.
Menerapkan ML ke kasus penggunaan tertentu: Contohnya mencakup deteksi anomali serta analisis dan ringkasan sentimen dengan Gemma.

Semua tutorial

Filter menurut:

Konsep Inti Dataflow &MLTransform	Pra-pemrosesan dengan Apache Beam DataFrames API Menunjukkan penggunaan Apache Beam DataFrames API untuk melakukan langkah-langkah umum eksplorasi dan pra-pemrosesan data.	Lihat Notebook
Konsep Inti Dataflow &MLTransform	Melakukan pra-pemrosesan data dengan MLTransform Pengantar dasar penggunaan MLTransform untuk melakukan pra-pemrosesan data dalam alur kerja machine learning.	Lihat Notebook
Pengayaan data &Embedding	Penyerapan Embedding Vektor dengan Apache Beam dan AlloyDB Menunjukkan cara membuat embedding dari data dan memasukkannya ke AlloyDB menggunakan Apache Beam dan Dataflow untuk pemrosesan data yang skalabel.	Lihat Notebook
Pengayaan data &Embedding	Menggunakan Apache Beam dan BigQuery untuk memperkaya data Menunjukkan cara memperkaya data menggunakan transformasi pengayaan Apache Beam dengan BigQuery.	Lihat Notebook
Pengayaan data &Embedding	Penyerapan Embedding dan Penelusuran Vektor dengan Apache Beam dan BigQuery Menunjukkan cara menggunakan paket Apache Beam RAG untuk membuat embedding, memasukkannya ke BigQuery, dan melakukan penelusuran kemiripan vektor.	Lihat Notebook
Pengayaan data &Embedding	Menggunakan Apache Beam dan Bigtable untuk memperkaya data Menunjukkan cara memperkaya data menggunakan transformasi pengayaan Apache Beam dengan Bigtable.	Lihat Notebook
Pengayaan data &Embedding	Membuat embedding teks menggunakan model Hugging Face Hub Menggunakan MLTransform untuk membuat embedding dari data teks menggunakan framework SentenceTransformers Hugging Face.	Lihat Notebook
Pengayaan data &Embedding	Menggunakan Apache Beam dan Vertex AI Feature Store untuk memperkaya data Menunjukkan cara memperkaya data menggunakan transformasi pengayaan Apache Beam dengan Vertex AI Feature Store.	Lihat Notebook
Pengayaan data &Embedding	Membuat embedding teks menggunakan Vertex AI API Menggunakan Vertex AI text-embeddings API untuk membuat embedding teks yang menggunakan model AI generatif besar Google.	Lihat Notebook
Pelatihan model &Pemrosesan data	Memperbarui model ML dalam pipeline yang berjalan Menunjukkan cara melakukan pembaruan model otomatis tanpa menghentikan pipeline Apache Beam menggunakan input samping.	Lihat Notebook
Pelatihan model &Pemrosesan data	Menghitung dan menerapkan kosakata pada set data Menunjukkan cara menggunakan MLTransform untuk membuat kosakata pada teks input dan menetapkan nilai indeks ke setiap token.	Lihat Notebook
Pelatihan model &Pemrosesan data	Menjalankan inferensi ML dengan beberapa model yang dilatih secara berbeda Menunjukkan cara menggunakan KeyedModelHandler untuk menjalankan inferensi dalam pipeline Apache Beam dengan beberapa model berbeda berdasarkan per kunci.	Lihat Notebook
Pelatihan model &Pemrosesan data	Menggunakan MLTransform untuk menskalakan data Menunjukkan cara menggunakan MLTransform untuk menskalakan data, langkah pra-pemrosesan penting untuk melatih model machine learning (ML).	Lihat Notebook
Pelatihan model &Pemrosesan data	Analisis Model TensorFlow di Beam Menunjukkan cara menggunakan TFMA untuk menyelidiki dan memvisualisasikan performa model sebagai bagian dari pipeline Apache Beam dengan membuat dan membandingkan dua model.	Lihat Notebook
Menjalankan inferensi	Inferensi jarak jauh di Apache Beam Menunjukkan cara menerapkan panggilan inferensi kustom di Apache Beam menggunakan Google Cloud Vision API.	Lihat Notebook
Menjalankan inferensi	Membawa model ML Anda sendiri ke Beam RunInference Mengilustrasikan cara menggunakan paket spaCy untuk memuat model machine learning (ML) dan melakukan inferensi dalam pipeline Apache Beam menggunakan RunInference PTransform.	Lihat Notebook
Menjalankan inferensi	Menjalankan inferensi dengan model terbuka Gemma Menunjukkan cara memuat model Gemma 2B yang telah dikonfigurasi sebelumnya, lalu menggunakannya dalam pipeline inferensi Apache Beam.	Lihat Notebook
Menjalankan inferensi	Menggunakan RunInference untuk AI Generatif Menunjukkan cara menggunakan transformasi Apache Beam RunInference untuk tugas AI generatif dengan model bahasa besar (LLM) dari Hugging Face Model Hub.	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference dengan Hugging Face Menunjukkan cara menggunakan model dari Hugging Face dan pipeline Hugging Face di pipeline Apache Beam yang menggunakan transformasi RunInference.	Lihat Notebook
Menjalankan inferensi	Model ensemble menggunakan contoh pemberian teks dan peringkat gambar Menunjukkan cara menerapkan model kaskade di Apache Beam menggunakan RunInference API untuk pemberian teks gambar.	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference untuk PyTorch Menunjukkan penggunaan transformasi RunInference untuk PyTorch.	Lihat Notebook
Menjalankan inferensi	Menggunakan RunInference di Apache Beam Menunjukkan cara menggunakan RunInference API dengan tiga framework ML populer: PyTorch, TensorFlow, dan scikit-learn.	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference untuk scikit-learn Menunjukkan penggunaan transformasi RunInference untuk scikit-learn.	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference dengan TensorFlow Menunjukkan cara menggunakan transformasi Apache Beam RunInference untuk TensorFlow.	Lihat Notebook
Menjalankan inferensi	Menggunakan RunInference dengan TFX Basic Shared Libraries Menunjukkan cara menggunakan transformasi Apache Beam RunInference dengan TensorFlow dan TFX Basic Shared Libraries (tfx-bsl).	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference dengan TensorFlow dan TensorFlow Hub Menunjukkan cara menggunakan transformasi Apache Beam RunInference untuk TensorFlow dengan model terlatih dari TensorFlow Hub.	Lihat Notebook
Menjalankan inferensi	Apache Beam RunInference dengan Vertex AI Menunjukkan cara menggunakan transformasi Apache Beam RunInference untuk klasifikasi gambar dengan Vertex AI.	Lihat Notebook
Menjalankan inferensi	Menjalankan inferensi ML menggunakan vLLM di GPU Menunjukkan cara menjalankan inferensi machine learning menggunakan vLLM dan GPU.	Lihat Notebook
Menjalankan inferensi	Menggunakan TPU di Dataflow Menunjukkan cara mengonfigurasi dan menjalankan dua pipeline Dataflow berbeda yang memanfaatkan Tensor Processing Unit (TPU). Pipeline pertama melakukan komputasi sederhana untuk mengonfirmasi akses TPU, sedangkan pipeline kedua yang lebih kompleks menjalankan inferensi dengan model Gemma-3-27b-it.	Lihat Notebook
Kasus penggunaan khusus	Deteksi Anomali pada Data Batch dan Streaming menggunakan Apache Beam (Metode Z-Score) Menunjukkan cara melakukan deteksi anomali pada data batch dan streaming menggunakan AnomalyDetection PTransform dengan algoritma Z-Score.	Lihat Notebook
Kasus penggunaan khusus	Menggunakan Gemma untuk mengukur sentimen dan meringkas percakapan Menunjukkan cara menggunakan Gemma untuk mengukur sentimen percakapan, meringkas konten percakapan, dan membuat draf balasan.	Lihat Notebook

Notebook ML Dataflow Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Semua tutorial

Notebook ML Dataflow