Penyajian fitur

Dokumen ini menjelaskan opsi Anda untuk menyediakan fitur untuk pelatihan dan inferensi model BigQuery ML. Untuk semua opsi, Anda harus menyimpan fitur di tabel BigQuery sebagai langkah prasyarat pertama.

Kebenaran point-in-time

Data yang digunakan untuk melatih model sering kali memiliki dependensi waktu yang terintegrasi. Saat membuat tabel fitur untuk fitur yang sensitif terhadap waktu, sertakan kolom stempel waktu untuk merepresentasikan nilai fitur seperti yang ada pada waktu tertentu untuk setiap baris. Kemudian, Anda dapat menggunakan fungsi pencarian point-in-time saat membuat kueri data dari tabel fitur ini untuk memastikan tidak ada kebocoran data antara pelatihan dan penyajian. Proses ini memungkinkan kebenaran point-in-time.

Gunakan fungsi berikut untuk menentukan batas waktu tertentu saat mengambil fitur yang sensitif terhadap waktu:

Menyajikan fitur di BigQuery ML

Untuk melatih model dan melakukan inferensi batch di BigQuery ML, Anda dapat mengambil fitur menggunakan salah satu fungsi pencarian point-in-time yang dijelaskan di bagian Kebenaran point-in-time. Anda dapat menyertakan fungsi ini dalam query_statement klausa dari pernyataan CREATE MODEL untuk pelatihan, atau dalam klausa query_statement dari fungsi bernilai tabel yang sesuai, seperti ML.PREDICT, untuk penyajian.

Menyajikan fitur dengan Vertex AI Feature Store

Untuk menyajikan fitur ke model BigQuery ML yang terdaftar di Gemini Enterprise Agent Platform, Anda dapat menggunakan Vertex AI Feature Store. Vertex AI Feature Store berfungsi di atas tabel fitur di BigQuery untuk mengelola dan menyajikan fitur dengan latensi rendah. Anda dapat menggunakan penyajian online untuk mengambil fitur secara real time untuk prediksi online, dan Anda dapat menggunakan penyajian offline untuk mengambil fitur untuk pelatihan model.

Untuk mengetahui informasi selengkapnya tentang cara menyiapkan data fitur BigQuery untuk digunakan di Vertex AI Feature Store, lihat Menyiapkan sumber data.