Membuat prediksi dengan model jarak jauh di Vertex AI

Dalam tutorial ini, Anda akan mendaftarkan endpoint Vertex AI sebagai model jarak jauh di BigQuery. Kemudian, Anda menggunakan fungsi ML.PREDICT untuk membuat prediksi menggunakan model jarak jauh.

Anda dapat menggunakan model jarak jauh saat model terlalu besar untuk diimpor ke BigQuery. Model ini juga berguna saat Anda ingin memiliki satu titik inferensi untuk kasus penggunaan online, batch, dan batch mikro.

Tujuan

  • Impor model TensorFlow terlatih ke Vertex AI Model Registry.
  • Deploy model ke endpoint Vertex AI.
  • Buat koneksi resource Cloud.
  • Gunakan pernyataan CREATE MODEL untuk membuat model jarak jauh di BigQuery.
  • Gunakan fungsi ML.PREDICT untuk membuat prediksi dengan model jarak jauh.

Biaya

Dalam dokumen ini, Anda akan menggunakan komponen Google Cloudyang dapat ditagih berikut:

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Pengguna Google Cloud baru mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Setelah menyelesaikan tugas yang dijelaskan dalam dokumen ini, Anda dapat menghindari penagihan berkelanjutan dengan menghapus resource yang Anda buat. Untuk mengetahui informasi selengkapnya, baca bagian Pembersihan.

Sebelum memulai

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  4. Verifikasi bahwa penagihan diaktifkan untuk project Google Cloud Anda.

  5. Aktifkan BigQuery, Vertex AI, Cloud Storage, dan BigQuery Connection API.

    Peran yang diperlukan untuk mengaktifkan API

    Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.

    Aktifkan API

  6. Pastikan Anda memiliki izin yang diperlukan untuk melakukan tugas dalam dokumen ini.

Peran yang diperlukan

Jika membuat project baru, Anda adalah pemilik project, dan Anda akan diberi semua izin IAM yang diperlukan untuk menyelesaikan tutorial ini.

Jika Anda menggunakan project yang sudah ada, lakukan hal berikut.

Pastikan Anda memiliki peran berikut di project:

Memeriksa peran

  1. Di konsol Google Cloud , buka halaman IAM.

    Buka IAM
  2. Pilih project.
  3. Di kolom Akun utama, temukan semua baris yang mengidentifikasi Anda atau grup yang Anda ikuti. Untuk mengetahui grup mana saja yang Anda ikuti, hubungi administrator Anda.

  4. Untuk semua baris yang menentukan atau menyertakan Anda, periksa kolom Peran untuk melihat apakah daftar peran menyertakan peran yang diperlukan.

Memberikan peran

  1. Di konsol Google Cloud , buka halaman IAM.

    Buka IAM
  2. Pilih project.
  3. Klik Grant access.
  4. Di kolom New principals, masukkan ID pengguna Anda. Biasanya, ini adalah alamat email untuk Akun Google.

  5. Klik Pilih peran, lalu telusuri peran.
  6. Untuk memberikan peran tambahan, klik Add another role, lalu tambahkan tiap peran tambahan.
  7. Klik Simpan.

Untuk mengetahui informasi selengkapnya tentang izin IAM di BigQuery, lihat Izin BigQuery.

Mengimpor model ke Vertex AI Model Registry

Dalam tutorial ini, Anda menggunakan model TensorFlow terlatih yang tersedia di Cloud Storage di gs://cloud-samples-data/bigquery/ml/remote_model_tutorial/. Bucket Cloud Storage berada di lokasi multi-region US.

Model ini adalah model TensorFlow yang bernama saved_model.pb. Model ini adalah model analisis sentimen yang disesuaikan yang dibuat dengan menyelaraskan model BERT dengan ulasan film IMDB dalam teks biasa. Model ini menggunakan input teks dari ulasan film dan mengembalikan skor sentimen antara nol dan satu. Saat mengimpor model ke Model Registry, Anda menggunakan container TensorFlow bawaan.

Ikuti langkah-langkah berikut untuk mengimpor model.

  1. Di konsol Google Cloud , buka halaman Model Registry Vertex AI.

    Buka Model Registry

  2. Klik Import.

  3. Untuk Langkah satu: Nama dan region, lakukan hal berikut:

    1. Pilih Import as new model.

    2. Untuk Name, masukkan bert_sentiment.

    3. Untuk Description, masukkan BQML tutorial model.

    4. Untuk Region, pilih us-central1. Anda harus memilih region berbasis AS karena bucket Cloud Storage berada di lokasi US multi-region.

    5. Klik Lanjutkan.

  4. Untuk Langkah kedua: Setelan model, lakukan hal berikut:

    1. Pilih Import model artifacts into a new prebuilt container.

    2. Di bagian Prebuilt container settings, lakukan hal berikut:

      1. Untuk Model framework, pilih TensorFlow.

      2. Untuk Versi framework model, pilih 2.15.

      3. Untuk Jenis akselerator, pilih GPU.

      4. Untuk Lokasi artefak model, masukkan gs://cloud-samples-data/bigquery/ml/remote_model_tutorial/.

      5. Biarkan nilai default untuk semua opsi yang tersisa, lalu klik Impor.

Setelah impor selesai, model Anda akan muncul di halaman Model Registry.

Men-deploy model ke endpoint Vertex AI

Ikuti langkah-langkah berikut untuk men-deploy model ke endpoint.

  1. Di konsol Google Cloud , buka halaman Model Registry Vertex AI.

    Buka Model Registry

  2. Di kolom Nama, klik bert_sentiment.

  3. Klik tab Deploy & Test.

  4. Klik Deploy to endpoint.

  5. Untuk langkah pertama, Tentukan endpoint Anda, lakukan hal berikut:

    1. Klik Buat endpoint baru.

    2. Untuk Endpoint name, masukkan bert sentiment endpoint.

    3. Biarkan nilai default yang tersisa, lalu klik Lanjutkan.

  6. Untuk langkah kedua, Setelan model, lakukan hal berikut:

    1. Di bagian Setelan komputasi, untuk Jumlah minimum node komputasi, masukkan 1. Ini adalah jumlah node yang harus selalu tersedia untuk model.

    2. Di bagian Opsi penskalaan lanjutan, untuk Jenis mesin, pilih Standard (n1-standard-2). Karena Anda memilih GPU sebagai jenis akselerator saat mengimpor model, setelah Anda memilih jenis mesin, jenis akselerator dan jumlah akselerator akan ditetapkan secara otomatis.

    3. Biarkan nilai default lainnya, lalu klik Deploy.

      Saat model di-deploy ke endpoint, status akan berubah menjadi Active.

    4. Salin ID endpoint numerik di kolom ID dan nilai di kolom Wilayah. Anda akan membutuhkannya nanti.

Membuat set data

Buat set data BigQuery untuk menyimpan model ML Anda.

Konsol

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka halaman BigQuery

  2. Di panel Explorer, klik nama project Anda.

  3. Klik View actions > Create dataset.

  4. Di halaman Create dataset, lakukan hal berikut:

    • Untuk Dataset ID, masukkan bqml_tutorial.

    • Untuk Location type, pilih Multi-region, lalu pilih US.

    • Jangan ubah setelan default yang tersisa, lalu klik Create dataset.

bq

Untuk membuat set data baru, gunakan perintah bq mk --dataset.

  1. Buat set data bernama bqml_tutorial dengan lokasi data ditetapkan ke US.

    bq mk --dataset \
      --location=US \
      --description "BigQuery ML tutorial dataset." \
      bqml_tutorial
  2. Pastikan set data telah dibuat:

    bq ls

API

Panggil metode datasets.insert dengan resource set data yang ditentukan.

{
  "datasetReference": {
     "datasetId": "bqml_tutorial"
  }
}

Membuat koneksi resource BigQuery Cloud

Anda harus memiliki koneksi resource Cloud untuk terhubung ke endpoint Vertex AI.

Konsol

  1. Buka halaman BigQuery.

    Buka BigQuery

  2. Di panel kiri, klik Explorer:

    Tombol yang ditandai untuk panel Explorer.

    Jika Anda tidak melihat panel kiri, klik Luaskan panel kiri untuk membuka panel.

  3. Di panel Penjelajah, klik Tambahkan data.

    Dialog Tambahkan data akan terbuka.

  4. Di panel Filter Menurut, di bagian Jenis Sumber Data, pilih Database.

    Atau, di kolom Telusuri sumber data, Anda dapat memasukkan Vertex AI.

  5. Di bagian Sumber data unggulan, klik Vertex AI.

  6. Klik kartu solusi Vertex AI Models: BigQuery Federation.

  7. Dalam daftar Connection type, pilih Vertex AI remote models, remote functions and BigLake (Cloud Resource).

  8. Di kolom Connection ID, masukkan bqml_tutorial.

  9. Pastikan Multi-region—US dipilih.

  10. Klik Create connection.

  11. Di bagian bawah jendela, klik Go to connection. Atau, di panel Explorer, klik Connections, lalu klik us.bqml_tutorial.

  12. Di panel Connection info, salin ID akun Layanan. Anda memerlukan ID ini saat mengonfigurasi izin untuk koneksi. Saat Anda membuat resource koneksi, BigQuery akan membuat akun layanan sistem unik dan mengaitkannya dengan koneksi.

bq

  1. Buat koneksi:

    bq mk --connection --location=US --project_id=PROJECT_ID \
        --connection_type=CLOUD_RESOURCE bqml_tutorial

    Ganti PROJECT_ID dengan Google Cloud project ID Anda. Parameter --project_id akan menggantikan project default.

    Saat Anda membuat resource koneksi, BigQuery akan membuat akun layanan sistem unik dan mengaitkannya dengan koneksi.

    Pemecahan masalah: Jika Anda mendapatkan error koneksi berikut, update Google Cloud SDK:

    Flags parsing error: flag --connection_type=CLOUD_RESOURCE: value should be one of...
    
  2. Ambil dan salin ID akun layanan untuk digunakan pada langkah berikutnya:

    bq show --connection PROJECT_ID.us.bqml_tutorial

    Outputnya mirip dengan hal berikut ini:

    name                          properties
    1234.REGION.CONNECTION_ID {"serviceAccountId": "connection-1234-9u56h9@gcp-sa-bigquery-condel.iam.gserviceaccount.com"}
    

Menyiapkan akses koneksi

Berikan peran Vertex AI User ke akun layanan koneksi resource Cloud. Anda harus memberikan peran ini di project yang sama tempat Anda membuat endpoint model jarak jauh.

Untuk memberikan peran, ikuti langkah-langkah berikut:

  1. Buka halaman IAM & Admin.

    Buka IAM & Admin

  2. Klik Berikan Akses.

  3. Di kolom New principals, masukkan ID akun layanan koneksi resource Cloud yang Anda salin sebelumnya.

  4. Di kolom Pilih peran, pilih Vertex AI, lalu pilih Pengguna Vertex AI.

  5. Klik Simpan.

Membuat model jarak jauh BigQuery ML

Anda membuat model jarak jauh BigQuery ML menggunakan pernyataan CREATE MODEL dengan klausa REMOTE WITH CONNECTION. Untuk mengetahui informasi selengkapnya tentang pernyataan CREATE MODEL, lihat Pernyataan CREATE MODEL untuk model jarak jauh melalui model kustom.

Anda membuat model di lokasi multi-region US. Dalam set data multi-region BigQuery (US, EU), Anda hanya dapat membuat model jarak jauh yang terhubung ke endpoint yang di-deploy di region dalam lokasi multi-region yang sama (US, EU).

Saat membuat model jarak jauh, Anda memerlukan ID endpoint yang dihasilkan saat Anda men-deploy model ke Vertex AI. Selain itu, nama dan jenis kolom input dan output harus sama persis dengan input dan output model Vertex AI. Dalam contoh ini, inputnya adalah teks STRING, dan outputnya adalah ARRAY berjenis FLOAT64.

Konsol

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka BigQuery

  2. Untuk Buat baru, klik Kueri SQL.

  3. Di editor kueri, masukkan pernyataan CREATE MODEL ini, lalu klik Run:

    CREATE OR REPLACE MODEL `PROJECT_ID.bqml_tutorial.bert_sentiment`
    INPUT (text STRING)
    OUTPUT(scores ARRAY<FLOAT64>)
    REMOTE WITH CONNECTION `PROJECT_ID.us.bqml_tutorial`
    OPTIONS(ENDPOINT = 'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/endpoints/ENDPOINT_ID')

    Ganti kode berikut:

    • PROJECT_ID: nama project Anda.
    • ENDPOINT_ID: ID endpoint yang Anda salin sebelumnya.

    Setelah operasi selesai, Anda akan melihat pesan yang mirip dengan Successfully created model named bert_sentiment.

    Model baru Anda akan muncul di panel Resources. Model ditunjukkan dengan ikon model: model
icon.

    Jika Anda memilih model baru di panel Resources, informasi tentang model akan muncul di bawah Query editor.

bq

  1. Buat model jarak jauh dengan memasukkan pernyataan CREATE MODEL berikut:

    bq query --use_legacy_sql=false \
    "CREATE OR REPLACE MODEL `PROJECT_ID.bqml_tutorial.bert_sentiment`
    INPUT (text STRING)
    OUTPUT(scores ARRAY<FLOAT64>)
    REMOTE WITH CONNECTION `PROJECT_ID.us.bqml_tutorial`
    OPTIONS(ENDPOINT = 'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/endpoints/ENDPOINT_ID')"

    Ganti kode berikut:

    • PROJECT_ID: nama project Anda.
    • ENDPOINT_ID: ID endpoint yang Anda salin sebelumnya.
  2. Setelah membuat model, verifikasi bahwa model muncul di set data:

    bq ls -m bqml_tutorial

    Outputnya mirip dengan hal berikut ini:

    Id               Model Type   Labels    Creation Time
    ---------------- ------------ -------- -----------------
    bert_sentiment                         28 Jan 17:39:43

Mendapatkan prediksi menggunakan ML.PREDICT

Anda menggunakan fungsi ML.PREDICT untuk mendapatkan prediksi sentimen dari model jarak jauh. Inputnya adalah kolom teks (review) yang berisi ulasan film dari tabel bigquery-public-data.imdb.reviews.

Dalam contoh ini, 10.000 data dipilih dan dikirim untuk prediksi. Model jarak jauh ditetapkan secara default ke ukuran batch 128 instance untuk permintaan.

Konsol

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka BigQuery

  2. Di bagian Create new, klik SQL query.

  3. Di editor kueri, masukkan kueri ini yang menggunakan fungsi ML.PREDICT, lalu klik Run.

    SELECT *
    FROM ML.PREDICT (
        MODEL `PROJECT_ID.bqml_tutorial.bert_sentiment`,
        (
            SELECT review as text
            FROM `bigquery-public-data.imdb.reviews`
            LIMIT 10000
        )
    )

    Hasil kueri akan terlihat seperti berikut:

    Hasil kueri

bq

Masukkan perintah ini untuk menjalankan kueri yang menggunakan ML.PREDICT.

bq query --use_legacy_sql=false \
'SELECT *
FROM ML.PREDICT (
MODEL `PROJECT_ID.bqml_tutorial.bert_sentiment`,
  (
    SELECT review as text
    FROM `bigquery-public-data.imdb.reviews`
    LIMIT 10000
  )
)'

Pembersihan

Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.

Menghapus project

Konsol

  1. Di Konsol Google Cloud , buka halaman Manage resources.

    Buka Kelola resource

  2. Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

gcloud

    Menghapus Google Cloud project:

    gcloud projects delete PROJECT_ID

Menghapus resource satu per satu

Atau, untuk menghapus setiap resource yang digunakan dalam tutorial ini:

  1. Hapus model.

  2. Opsional: Hapus set data.

  3. Batalkan deployment model dan hapus endpoint.

  4. Hapus model dari Model Registry.

  5. Hapus koneksi resource Cloud.

Langkah berikutnya