AI Generatif di Vertex AI (juga dikenal sebagai genAI atau gen AI) memberi Anda akses ke model AI generatif Google untuk berbagai modalitas (teks, kode, gambar, ucapan). Anda dapat menguji dan menyesuaikan model bahasa besar (LLM) ini, lalu men-deploy-nya untuk digunakan dalam aplikasi yang didukung AI. Untuk mengetahui informasi selengkapnya, lihat Ringkasan AI Generatif di Vertex AI.
Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API, termasuk model yang digunakan dalam panduan ini. Untuk mengetahui informasi selengkapnya tentang cara memilih model, lihat Model Google.
Setiap model diekspos melalui endpoint penayang yang khusus untuk projectGoogle Cloud Anda, sehingga tidak perlu men-deploy model dasar kecuali jika Anda perlu menyesuaikannya untuk kasus penggunaan tertentu. Anda dapat mengirim perintah ke endpoint penayang. Perintah adalah permintaan bahasa alami yang dikirim ke LLM untuk mendapatkan respons.
Tutorial ini menunjukkan alur kerja yang menghasilkan respons dari model Vertex AI dengan mengirimkan perintah teks ke endpoint penayang menggunakan konektor Workflows atau permintaan HTTP POST
. Untuk mengetahui informasi selengkapnya, lihat
Ringkasan konektor API Vertex AI
dan Membuat permintaan HTTP.
Perhatikan bahwa Anda dapat men-deploy dan menjalankan setiap alur kerja secara terpisah.
Men-deploy alur kerja yang mendeskripsikan gambar
Men-deploy alur kerja yang menggunakan metode konektor
(generateContent
) untuk membuat permintaan ke endpoint
penayang model. Metode ini memberikan dukungan untuk pembuatan konten dengan input multimodal.
Alur kerja ini menyediakan perintah teks dan URI gambar yang tersedia secara publik di bucket Cloud Storage. Anda dapat melihat gambar dan, di konsol Google Cloud , Anda dapat melihat detail objek.
Alur kerja menampilkan deskripsi gambar dari respons yang dihasilkan model.
Untuk mengetahui informasi selengkapnya tentang parameter isi permintaan HTTP yang digunakan saat meminta LLM, dan elemen isi respons, lihat referensi Gemini API.
Konsol
Di konsol Google Cloud , buka halaman Workflows.
Klik
Buat.Masukkan nama untuk alur kerja baru:
describe-image
.Di daftar Region, pilih us-central1 (Iowa).
Untuk Service account, pilih akun layanan yang Anda buat sebelumnya.
Klik Berikutnya.
Di editor alur kerja, masukkan definisi berikut untuk alur kerja Anda:
Klik Deploy.
gcloud
Buat file kode sumber untuk alur kerja Anda:
touch describe-image.yaml
Di editor teks, salin alur kerja berikut ke file kode sumber Anda:
Deploy alur kerja dengan memasukkan perintah berikut:
gcloud workflows deploy describe-image \ --source=describe-image.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Menjalankan alur kerja
Mengeksekusi alur kerja menjalankan definisi alur kerja saat ini yang terkait dengan alur kerja.
Konsol
Di konsol Google Cloud , buka halaman Workflows.
Di halaman Workflows, pilih alur kerja describe-image untuk membuka halaman detailnya.
Di halaman Workflow details, klik play_arrow Execute.
Untuk Input, masukkan hal berikut:
{"image_url":"gs://generativeai-downloads/images/scones.jpg"}
Klik Execute lagi.
Lihat hasil alur kerja di panel Output.
Outputnya akan mirip dengan berikut ini:
{ "image_description": "There are three pink peony flowers on the right side of the picture[]...]There is a white napkin on the table.", "image_url": "gs://generativeai-downloads/images/scones.jpg" }
gcloud
Buka terminal.
Menjalankan alur kerja:
gcloud workflows run describe-image \ --data='{"image_url":"gs://generativeai-downloads/images/scones.jpg"}'
Hasil eksekusinya akan mirip dengan berikut ini:
Waiting for execution [258b530e-a093-46d7-a4ff-cbf5392273c0] to complete...done. argument: '{"image_url":"gs://generativeai-downloads/images/scones.jpg"}' createTime: '2024-02-09T13:59:32.166409938Z' duration: 4.174708484s endTime: '2024-02-09T13:59:36.341118422Z' name: projects/1051295516635/locations/us-central1/workflows/describe-image/executions/258b530e-a093-46d7-a4ff-cbf5392273c0 result: "{\"image_description\":\"The picture shows a rustic table with a white surface,\ \ on which there are several scones with blueberries, as well as two cups of coffee\ [...] \ on the table. The background of the table is a dark blue color.\",\"image_url\"\ :\"gs://generativeai-downloads/images/scones.jpg\"}" startTime: '2024-02-09T13:59:32.166409938Z' state: SUCCEEDED
Men-deploy alur kerja yang menghasilkan histori negara
Deploy alur kerja yang melakukan loop pada daftar input negara secara
paralel
dan menggunakan metode konektor
(generateContent
) untuk membuat permintaan ke endpoint
penayang model. Metode ini memberikan dukungan untuk pembuatan konten dengan input multimodal.
Alur kerja menampilkan histori negara yang dihasilkan oleh model, menggabungkannya dalam peta.
Untuk mengetahui informasi selengkapnya tentang parameter isi permintaan HTTP yang digunakan saat meminta LLM, dan elemen isi respons, lihat referensi Gemini API.
Konsol
Di konsol Google Cloud , buka halaman Workflows.
Klik
Buat.Masukkan nama untuk alur kerja baru:
gemini-pro-country-histories
.Di daftar Region, pilih us-central1 (Iowa).
Untuk Service account, pilih akun layanan yang Anda buat sebelumnya.
Klik Berikutnya.
Di editor alur kerja, masukkan definisi berikut untuk alur kerja Anda:
Klik Deploy.
gcloud
Buat file kode sumber untuk alur kerja Anda:
touch gemini-pro-country-histories.yaml
Di editor teks, salin alur kerja berikut ke file kode sumber Anda:
Deploy alur kerja dengan memasukkan perintah berikut:
gcloud workflows deploy gemini-pro-country-histories \ --source=gemini-pro-country-histories.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Menjalankan alur kerja
Mengeksekusi alur kerja menjalankan definisi alur kerja saat ini yang terkait dengan alur kerja.
Konsol
Di konsol Google Cloud , buka halaman Workflows.
Di halaman Workflows, pilih alur kerja gemini-pro-country-histories untuk membuka halaman detailnya.
Di halaman Workflow details, klik play_arrow Execute.
Untuk Input, masukkan hal berikut:
{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}
Klik Execute lagi.
Lihat hasil alur kerja di panel Output.
Outputnya akan mirip dengan berikut ini:
{ "Argentina": "The history of Argentina is a complex and fascinating one, marked by periods of prosperity and decline, political [...] "Bhutan": "The history of Bhutan is a rich and fascinating one, dating back to the 7th century AD. Here is a brief overview: [...] "Cyprus": "The history of Cyprus is a long and complex one, spanning over 10,000 years. The island has been ruled by a succession [...] "Denmark": "1. **Prehistory and Early History (c. 12,000 BC - 800 AD)**\\n - The earliest evidence of human habitation in Denmark [...] "Ethiopia": "The history of Ethiopia is a long and complex one, stretching back to the earliest human civilizations. The country is [...] }
gcloud
Buka terminal.
Menjalankan alur kerja:
gcloud workflows run gemini-pro-country-histories \ --data='{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}' \ --location=us-central1
Hasil eksekusinya akan mirip dengan berikut ini:
Waiting for execution [7ae1ccf1-29b7-4c2c-99ec-7a12ae289391] to complete...done. argument: '{"countries":["Argentina","Bhutan","Cyprus","Denmark","Ethiopia"]}' createTime: '2024-02-09T16:25:16.742349156Z' duration: 12.075968673s endTime: '2024-02-09T16:25:28.818317829Z' name: projects/1051295516635/locations/us-central1/workflows/gemini-pro-country-histories/executions/7ae1ccf1-29b7-4c2c-99ec-7a12ae289391 result: "{\"Argentina\":\"The history of Argentina can be traced back to the arrival\ [...] n* 2015: Argentina elects Mauricio Macri as president.\",\"Bhutan\":\"The history\ [...] \ natural beauty, ancient monasteries, and friendly people.\",\"Cyprus\":\"The history\ [...] ,\"Denmark\":\"The history of Denmark can be traced back to the Stone Age, with\ [...] \ a high standard of living.\",\"Ethiopia\":\"The history of Ethiopia is long and\ [...] startTime: '2024-02-09T16:25:16.742349156Z' state: SUCCEEDED
Men-deploy alur kerja yang meringkas dokumen besar
Deploy alur kerja yang membagi dokumen besar menjadi bagian-bagian yang lebih kecil, sehingga membuat
http.post
permintaan ke endpoint penerbit model secara
paralel agar model dapat meringkas setiap bagian secara bersamaan. Alur kerja akhirnya menggabungkan semua ringkasan parsial menjadi
satu ringkasan lengkap.
Untuk mengetahui informasi selengkapnya tentang parameter isi permintaan HTTP yang digunakan saat meminta LLM, dan elemen isi respons, lihat referensi Gemini API.
Definisi alur kerja mengasumsikan bahwa Anda telah membuat bucket Cloud Storage yang dapat digunakan untuk mengupload file teks. Untuk mengetahui informasi selengkapnya
tentang konektor Workflows (googleapis.storage.v1.objects.get
)
yang digunakan untuk mengambil objek dari bucket Cloud Storage, lihat
Referensi konektor.
Setelah men-deploy alur kerja, Anda dapat mengeksekusinya dengan membuat pemicu Eventarc yang sesuai, lalu mengupload file ke bucket. Untuk
mengetahui informasi selengkapnya, lihat
Merutekan peristiwa Cloud Storage ke Workflows.
Perhatikan bahwa API tambahan harus diaktifkan, dan peran tambahan harus diberikan, termasuk memberikan peran Storage Object User (roles/storage.objectUser
) yang mendukung penggunaan objek Cloud Storage kepada akun layanan Anda. Untuk mengetahui informasi selengkapnya, lihat bagian
Bersiap membuat pemicu.
Konsol
Di konsol Google Cloud , buka halaman Workflows.
Klik
Buat.Masukkan nama untuk alur kerja baru:
gemini-pro-summaries
.Di daftar Region, pilih us-central1 (Iowa).
Untuk Service account, pilih akun layanan yang Anda buat sebelumnya.
Klik Berikutnya.
Di editor alur kerja, masukkan definisi berikut untuk alur kerja Anda:
Klik Deploy.
gcloud
Buat file kode sumber untuk alur kerja Anda:
touch gemini-pro-summaries.yaml
Di editor teks, salin alur kerja berikut ke file kode sumber Anda:
Deploy alur kerja dengan memasukkan perintah berikut:
gcloud workflows deploy gemini-pro-summaries \ --source=gemini-pro-summaries.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com