Dataflow ML 筆記本

探索 Dataflow ML 筆記本,將機器學習整合至 Apache Beam 管道。這些筆記本提供實用範例和指引,說明常見的機器學習工作流程。

請參閱下列資源:

  • 預先處理機器學習模型資料:包括縮放資料、計算詞彙,以及使用 MLTransform 準備資料等工作。
  • 使用各種模型和架構執行推論作業:搭配 PyTorch、TensorFlow、scikit-learn、Hugging Face 模型、Gemma 模型和 Gemini Enterprise Agent Platform 使用 RunInference 轉換,包括搭配 vLLM 在 GPU 上使用。
  • 生成及管理嵌入:使用 Agent Platform 或 Hugging Face 建立文字嵌入,並將其擷取至 AlloyDB 和 BigQuery 等資料庫,以進行向量搜尋。
  • 導入進階機器學習管道模式:包括在執行中的管道中自動重新整理模型、使用多個模型、建構集成模型,以及使用 BigQuery、Bigtable 和 Vertex AI 特徵儲存庫擴充資料。
  • 將機器學習技術用於特定用途:例如使用 Gemma 偵測異常狀況,以及進行情緒分析和摘要。

所有教學課程

篩選依據:
Dataflow 和 MLTransform 核心概念

使用 Apache Beam DataFrames API 進行前處理

示範如何使用 Apache Beam DataFrames API 執行常見的資料探索和預先處理步驟。

查看筆記本
Dataflow 和 MLTransform 核心概念

使用 MLTransform 預先處理資料

簡要介紹如何使用 MLTransform 預先處理機器學習工作流程的資料。

查看筆記本
data enrichment 與嵌入

使用 Apache Beam 和 AlloyDB 擷取向量嵌入

說明如何使用 Apache Beam 和 Dataflow 生成資料的嵌入,並將其擷取至 AlloyDB,以進行可擴充的資料處理作業。

查看筆記本
data enrichment 與嵌入

使用 Apache Beam 和 BigQuery 充實資料

說明如何使用 Apache Beam 擴充轉換和 BigQuery 擴充資料。

查看筆記本
data enrichment 與嵌入

使用 Apache Beam 和 BigQuery 擷取嵌入並進行向量搜尋

示範如何使用 Apache Beam RAG 套件生成嵌入、將嵌入擷取至 BigQuery,以及執行向量相似度搜尋。

查看筆記本
data enrichment 與嵌入

使用 Apache Beam 和 Bigtable 充實資料

說明如何使用 Apache Beam 資料擴充轉換功能和 Bigtable 充實資料。

查看筆記本
data enrichment 與嵌入

使用 Hugging Face Hub 模型生成文字嵌入

使用 MLTransform,透過 Hugging Face 的 SentenceTransformers 架構,從文字資料生成嵌入。

查看筆記本
data enrichment 與嵌入

使用 Apache Beam 和 Vertex AI 特徵儲存庫充實資料

說明如何使用 Apache Beam 資料擴充轉換功能和 Vertex AI 特徵儲存庫,充實資料。

查看筆記本
data enrichment 與嵌入

使用 Vertex AI API 生成文字嵌入

使用 Vertex AI 文字嵌入 API,透過 Google 的大型生成式人工智慧 (AI) 模型生成文字嵌入。

查看筆記本
模型訓練與資料處理

更新執行中管道的機器學習模型

示範如何使用輔助輸入,執行自動模型更新,而不必停止 Apache Beam 管道。

查看筆記本
模型訓練與資料處理

計算並套用資料集的詞彙

說明如何使用 MLTransform 在輸入文字中產生詞彙,並為每個權杖指派索引值。

查看筆記本
模型訓練與資料處理

使用多個訓練方式不同的模型執行機器學習推論

示範如何使用 KeyedModelHandler,在 Apache Beam 管道中,以每個鍵為基礎執行多個不同模型的推論。

查看筆記本
模型訓練與資料處理

使用 MLTransform 擴充資料

說明如何使用 MLTransform 擴充資料,這是訓練機器學習 (ML) 模型的重要預先處理步驟。

查看筆記本
模型訓練與資料處理

Beam 中的 TensorFlow Model Analysis

說明如何建立及比較兩個模型,藉此使用 TFMA 調查及視覺化呈現 Apache Beam 管道中模型的成效。

查看筆記本
執行推論

Apache Beam 中的遠端推論

示範如何使用 Google Cloud Vision API,在 Apache Beam 中實作自訂推論呼叫。

查看筆記本
執行推論

將自己的機器學習模型帶入 Beam RunInference

說明如何使用 spaCy 套件載入機器學習 (ML) 模型,並使用 RunInference PTransform 在 Apache Beam 管道中執行推論。

查看筆記本
執行推論

使用 Gemma 開放式模型執行推論

示範如何載入預先設定的 Gemma 2B 模型,然後在 Apache Beam 推論管道中使用該模型。

查看筆記本
執行推論

使用 RunInference 進行生成式 AI

說明如何使用 Apache Beam RunInference 轉換,透過 Hugging Face Model Hub 的大型語言模型 (LLM) 執行生成式 AI 工作。

查看筆記本
執行推論

Apache Beam RunInference with Hugging Face

說明如何在 Apache Beam 管道中使用 RunInference 轉換,並搭配使用 Hugging Face 模型和 Hugging Face 管道。

查看筆記本
執行推論

使用圖片說明文字和排序範例的集成模型

說明如何使用 RunInference API 實作 Apache Beam 中的連鎖模型,以生成圖片說明。

查看筆記本
執行推論

適用於 PyTorch 的 Apache Beam RunInference

示範如何搭配 PyTorch 使用 RunInference 轉換。

查看筆記本
執行推論

在 Apache Beam 中使用 RunInference

示範如何搭配三種熱門的機器學習架構 (PyTorch、TensorFlow 和 scikit-learn) 使用 RunInference API。

查看筆記本
執行推論

適用於 scikit-learn 的 Apache Beam RunInference

示範如何使用 scikit-learn 的 RunInference 轉換。

查看筆記本
執行推論

搭配 TensorFlow 使用 Apache Beam RunInference

說明如何使用 Apache Beam RunInference 轉換進行 TensorFlow。

查看筆記本
執行推論

搭配 TFX Basic Shared Libraries 使用 RunInference

示範如何搭配 TensorFlow 和 TFX Basic Shared Libraries (tfx-bsl) 使用 Apache Beam RunInference 轉換。

查看筆記本
執行推論

搭配 TensorFlow 和 TensorFlow Hub 使用 Apache Beam RunInference

說明如何搭配 TensorFlow Hub 中訓練的模型,使用 TensorFlow 的 Apache Beam RunInference 轉換。

查看筆記本
執行推論

Apache Beam RunInference with Vertex AI

說明如何使用 Apache Beam RunInference 轉換,透過 Vertex AI 進行圖片分類。

查看筆記本
執行推論

使用 GPU 上的 vLLM 執行 ML 推論

示範如何使用 vLLM 和 GPU 執行機器學習推論。

查看筆記本
執行推論

在 Dataflow 中使用 TPU

示範如何設定及執行兩個不同的 Dataflow 管道,並運用 Tensor Processing Unit (TPU)。第一個管道會執行簡單的運算,確認 TPU 存取權;第二個管道則較為複雜,會使用 Gemma-3-27b-it 模型執行推論。

查看筆記本
專業用途

使用 Apache Beam (Z 分數法) 偵測批次和串流資料中的異常狀況

說明如何使用 AnomalyDetection PTransform 和 Z 分數演算法,對批次和串流資料執行異常偵測。

查看筆記本
專業用途

使用 Gemma 評估情緒和歸納對話內容

示範如何使用 Gemma 評估對話的情緒、歸納對話內容,以及草擬回覆。

查看筆記本