Halaman ini diterjemahkan oleh Cloud Translation API.

Menganalisis data multimodal di Python dengan BigQuery DataFrames

Tutorial ini menunjukkan cara menganalisis data multimodal di notebook Python menggunakan kelas dan metode BigQuery DataFrames.

Tutorial ini menggunakan katalog produk dari set data toko hewan Cymbal publik.

Untuk mengupload notebook yang sudah diisi dengan tugas yang dibahas dalam tutorial ini, lihat DataFrame Multimodal BigFrames.

Tujuan

Buat DataFrame multimodal.
Gabungkan data terstruktur dan tidak terstruktur dalam DataFrame.
Mentransformasi gambar.
Menghasilkan teks dan embedding berdasarkan data gambar.
Mengelompokkan PDF untuk analisis lebih lanjut.

Biaya

Di dokumen ini, Anda akan menggunakan komponen Google Cloudyang dapat ditagih berikut:

BigQuery: you incur costs for the data that you process in BigQuery.
BigQuery Python UDFs: you incur costs for using BigQuery DataFrames image transformation and chunk PDF methods.
Cloud Storage: you incur costs for the objects stored in Cloud Storage.
Vertex AI: you incur costs for calls to Vertex AI models.

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Pengguna Google Cloud baru mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Untuk mengetahui informasi selengkapnya, lihat halaman harga berikut:

Sebelum memulai

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, BigQuery Connection, Cloud Storage, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the APIs

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk menyelesaikan tutorial ini, minta administrator Anda untuk memberi Anda peran IAM berikut:

Membuat koneksi: BigQuery Connection Admin (roles/bigquery.connectionAdmin)
Memberikan izin ke akun layanan koneksi: Project IAM Admin (roles/resourcemanager.projectIamAdmin)
Buat bucket Cloud Storage: Storage Admin (roles/storage.admin)
Menjalankan tugas BigQuery: BigQuery User (roles/bigquery.user)
Membuat dan memanggil UDF Python: BigQuery Data Editor (roles/bigquery.dataEditor)
Buat URL yang memungkinkan Anda membaca dan mengubah objek Cloud Storage: BigQuery ObjectRef Admin (roles/bigquery.objectRefAdmin)
Menggunakan notebook:
- BigQuery Read Session User (roles/bigquery.readSessionUser)
- Pengguna Runtime Notebook (roles/aiplatform.notebookRuntimeUser)
- Pengguna Runtime Notebook (roles/aiplatform.notebookRuntimeUser)
- Pembuat Kode (roles/dataform.codeCreator)

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Siapkan

Di bagian ini, Anda akan membuat bucket Cloud Storage, koneksi, dan notebook yang digunakan dalam tutorial ini.

Membuat bucket

Buat bucket Cloud Storage untuk menyimpan objek yang telah diubah:

Di konsol Google Cloud , buka halaman Buckets.

Buka Bucket
Klik Create.
Di halaman Create a bucket, di bagian Get started, masukkan nama yang unik secara global dan memenuhi persyaratan nama bucket.
Klik Buat.

Membuat koneksi

Buat koneksi resource Cloud dan dapatkan akun layanan koneksi. BigQuery menggunakan koneksi untuk mengakses objek di Cloud Storage.

Buka halaman BigQuery.

Buka BigQuery
Di panel Penjelajah, klik Tambahkan data.

Dialog Tambahkan data akan terbuka.
Di panel Filter Menurut, di bagian Jenis Sumber Data, pilih Aplikasi Bisnis.

Atau, di kolom Telusuri sumber data, Anda dapat memasukkan Vertex AI.
Di bagian Sumber data unggulan, klik Vertex AI.
Klik kartu solusi Vertex AI Models: BigQuery Federation.
Dalam daftar Connection type, pilih Vertex AI remote models, remote functions, BigLake and Spanner (Cloud Resource).
Di kolom Connection ID, ketik bigframes-default-connection.
Klik Create connection.
Klik Go to connection.
Di panel Connection info, salin ID akun layanan untuk digunakan di langkah berikutnya.

Memberikan izin ke akun layanan koneksi

Berikan peran yang diperlukan akun layanan koneksi untuk mengakses Cloud Storage dan Vertex AI. Anda harus memberikan peran ini di project yang sama dengan yang Anda buat atau pilih di bagian Sebelum memulai.

Untuk memberikan peran, ikuti langkah-langkah berikut:

Buka halaman IAM & Admin.

Buka IAM & Admin
Klik Grant access.
Di kolom New principals, masukkan ID akun layanan yang Anda salin sebelumnya.
Di kolom Select a role, pilih Cloud Storage, lalu pilih Storage Object User.
Klik Add another role.
Di kolom Pilih peran, pilih Vertex AI, lalu pilih Pengguna Vertex AI.
Klik Simpan.

Membuat notebook

Buat notebook tempat Anda dapat menjalankan kode Python:

Buka halaman BigQuery.

Buka BigQuery
Di panel tab panel editor, klik panah drop-down di samping SQL query, lalu klik Notebook.
Di panel Start with a template, klik Close.
Klik Hubungkan > Hubungkan ke runtime.
Jika Anda memiliki runtime yang ada, terima setelan default, lalu klik Connect. Jika Anda belum memiliki runtime, pilih Create new Runtime, lalu klik Connect.

Mungkin perlu waktu beberapa menit hingga runtime disiapkan.

Membuat DataFrame multimodal

Buat DataFrame multimodal yang mengintegrasikan data terstruktur dan tidak terstruktur dengan menggunakan metode from_glob_path dari kelas Session:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

import bigframes

# Flags to control preview image/video preview size
bigframes.options.display.blob_display_width = 300

import bigframes.pandas as bpd

# Create blob columns from wildcard path.
df_image = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/images/*", name="image"
)
# Other ways are: from string uri column
# df = bpd.DataFrame({"uri": ["gs://<my_bucket>/<my_file_0>", "gs://<my_bucket>/<my_file_1>"]})
# df["blob_col"] = df["uri"].str.to_blob()

# From an existing object table
# df = bpd.read_gbq_object_table("<my_object_table>", name="blob_col")

# Take only the 5 images to deal with. Preview the content of the Mutimodal DataFrame
df_image = df_image.head(5)
df_image

Klik Run.

Panggilan terakhir ke df_image menampilkan gambar yang telah ditambahkan ke DataFrame. Atau, Anda dapat memanggil metode .display.

Menggabungkan data terstruktur dan tidak terstruktur di DataFrame

Gabungkan data teks dan gambar dalam DataFrame multimodal:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

# Combine unstructured data with structured data
df_image["author"] = ["alice", "bob", "bob", "alice", "bob"]  # type: ignore
df_image["content_type"] = df_image["image"].blob.content_type()
df_image["size"] = df_image["image"].blob.size()
df_image["updated"] = df_image["image"].blob.updated()
df_image

Klik Run .

Kode ini akan menampilkan data DataFrame.

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

# Filter images and display, you can also display audio and video types. Use width/height parameters to constrain window sizes.
df_image[df_image["author"] == "alice"]["image"].blob.display()

Klik Run .

Kode ini menampilkan gambar dari DataFrame dengan nilai kolom author adalah alice.

Melakukan transformasi gambar

Ubah data gambar menggunakan metode berikut dari class Series.BlobAccessor:

Gambar yang ditransformasi ditulis ke Cloud Storage.

Mentransformasi gambar:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

df_image["blurred"] = df_image["image"].blob.image_blur(
    (20, 20), dst=f"{dst_bucket}/image_blur_transformed/", engine="opencv"
)
df_image["resized"] = df_image["image"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_resize_transformed/", engine="opencv"
)
df_image["normalized"] = df_image["image"].blob.image_normalize(
    alpha=50.0,
    beta=150.0,
    norm_type="minmax",
    dst=f"{dst_bucket}/image_normalize_transformed/",
    engine="opencv",
)

# You can also chain functions together
df_image["blur_resized"] = df_image["blurred"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_blur_resize_transformed/", engine="opencv"
)
df_image

Perbarui semua referensi ke {dst_bucket} agar merujuk ke bucket yang Anda buat, dalam format gs://mybucket.
Klik Run .

Kode ini menampilkan gambar asli serta semua transformasinya.

Buat teks

Membuat teks dari data multimodal menggunakan metode predict dari class GeminiTextGenerator:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

from bigframes.ml import llm

gemini = llm.GeminiTextGenerator(model_name="gemini-2.0-flash-001")

# Deal with first 2 images as example
df_image = df_image.head(2)

# Ask the same question on the images
df_image = df_image.head(2)
answer = gemini.predict(df_image, prompt=["what item is it?", df_image["image"]])
answer[["ml_generate_text_llm_result", "image"]]

Klik Run .

Kode ini menampilkan dua gambar pertama di df_image, beserta teks yang dihasilkan sebagai respons terhadap pertanyaan what item is it? untuk kedua gambar.

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

# Ask different questions
df_image["question"] = [  # type: ignore
    "what item is it?",
    "what color is the picture?",
]
answer_alt = gemini.predict(
    df_image, prompt=[df_image["question"], df_image["image"]]
)
answer_alt[["ml_generate_text_llm_result", "image"]]

Klik Run .

Kode ini menampilkan dua gambar pertama di df_image, dengan teks yang dihasilkan sebagai respons terhadap pertanyaan what item is it? untuk gambar pertama, dan teks yang dihasilkan sebagai respons terhadap pertanyaan what color is the picture? untuk gambar kedua.

Membuat embedding

Buat embedding untuk data multimodal menggunakan metode predict dari class MultimodalEmbeddingGenerator:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

# Generate embeddings on images
embed_model = llm.MultimodalEmbeddingGenerator()
embeddings = embed_model.predict(df_image["image"])
embeddings

Klik Run .

Kode ini menampilkan embedding yang dihasilkan oleh panggilan ke model embedding.

Membagi PDF

Kelompokkan objek PDF menggunakan metode pdf_chunk dari class Series.BlobAccessor:

Di notebook, buat sel kode dan salin kode berikut ke dalamnya:

# PDF chunking
df_pdf = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/documents/*", name="pdf"
)
df_pdf["chunked"] = df_pdf["pdf"].blob.pdf_chunk(engine="pypdf")
chunked = df_pdf["chunked"].explode()
chunked

Klik Run .

Kode ini menampilkan data PDF yang dipecah-pecah.

Pembersihan

Perhatian: Penghapusan project memiliki efek berikut:

Semua hal dalam project akan dihapus. Jika Anda menggunakan project Anda sendiri untuk mengerjakan tugas dalam dokumen ini, saat Anda menghapusnya, pekerjaan lain dalam project tersebut juga akan dihapus.
Project ID kustom akan hilang. Saat membuat project ini, Anda mungkin juga membuat project ID kustom yang masih ingin Anda gunakan pada masa mendatang. Agar tidak kehilangan URL yang menggunakan project ID tersebut, seperti URL appspot.com, hapus resource yang dipilih di dalam project, bukan menghapus seluruh project.

Jika Anda berencana mempelajari beberapa arsitektur, tutorial atau panduan memulai, dengan menggunakan kembali project dapat membantu Anda agar tidak melampaui batas kuota project.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.