Dokumen ini menjelaskan cara merencanakan dan mendesain cluster dengan meminta Gemini.
Anda dapat menggunakan Gemini di konsol Google Cloud sebagai antarmuka yang didukung AI untuk mengevaluasi opsi hardware, memperkirakan biaya deployment, dan melihat konfigurasi yang direkomendasikan untuk cluster Anda. Untuk menyesuaikan rekomendasinya, Gemini mengevaluasi project Anda dengan memeriksa batas kuota, reservasi yang ada, diskon abonemen (DA), region dan zona default, serta batasan lokasi resource. Google Cloud Dengan menggunakan Gemini untuk membantu perencanaan, Anda dapat mencapai konfigurasi optimal untuk beban kerja sebelum membuat atau mengubah cluster.
Untuk mempelajari lebih lanjut komponen yang harus Anda konfigurasi sebelum atau saat membuat cluster, lihat Ringkasan opsi deployment.
Batasan
Saat memberikan perintah kepada Gemini di konsol Google Cloud , Anda tidak dapat membuat, mengubah, atau menghapus resource menggunakan Gemini.
Sebelum memulai
Saat menggunakan konsol Google Cloud untuk mengakses layanan Google Cloud dan API, Anda tidak perlu menyiapkan autentikasi.
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan untuk mengakses dan meminta Gemini, minta administrator untuk memberi Anda peran IAM Cluster Director Viewer (roles/hypercomputecluster.viewer) di project.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk mengakses dan meminta Gemini. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk mengakses dan meminta Gemini:
-
Untuk melihat daftar cluster:
hypercomputecluster.clusters.list
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Mengakses Gemini di konsol Google Cloud
Untuk mengakses Gemini di konsol Google Cloud , selesaikan langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Overview.
Di bagian Merancang infrastruktur Anda dengan Compute Advisor, klik Mulai percakapan baru.
Di halaman Compute Advisor, Anda dapat melihat hal berikut:
Elemen UI yang ditampilkan dalam screenshot sebelumnya adalah sebagai berikut:
Panel samping histori percakapan: menampilkan percakapan terbaru Anda. Anda dapat berinteraksi dengan panel ini sebagai berikut:
Untuk memulai percakapan baru, klik Percakapan baru.
Untuk melanjutkan percakapan terbaru, di bagian Percakapan terbaru, klik percakapan.
Untuk melihat daftar semua percakapan Anda, klik Lihat semua. Di halaman Histori saya, Anda dapat melihat detail percakapan sebelumnya dan melanjutkannya, atau menghapus percakapan jika tidak lagi memerlukannya.
Kartu perintah tindakan cepat: sekumpulan kartu yang masing-masing berisi contoh perintah. Jika Anda mengklik kartu, konsol Google Cloud akan otomatis mengisi kotak perintah dengan contoh perintah.
Kotak perintah: kolom ini memungkinkan Anda memasukkan dan mengirimkan perintah. Untuk mengirimkan perintah, klik Kirim perintah.
Memasukkan perintah ke Gemini
Setelah Anda mengirimkan perintah, Gemini akan mulai membuat respons. Panel akan muncul dan Google Cloud konsol akan menampilkan respons terhadap perintah Anda di panel, seperti yang ditunjukkan pada screenshot berikut:
Berdasarkan perintah Anda, panel respons mencakup elemen berikut:
Pengandasan kontekstual: Gemini secara otomatis mengevaluasi konteks project Anda untuk memberikan rekomendasi yang sangat disesuaikan, termasuk batas kuota, reservasi yang ada, CUD, region dan zona default Anda, serta batasan lokasi resource.
Cuplikan kode interaktif: Gemini membuat perintah gcloud, metode REST API, atau resource Terraform. Anda dapat menyalin dan menempelkan cuplikan kode ini atau menjalankannya di Cloud Shell.
Kanvas visual: Gemini mengatur rekomendasi ke dalam tabel terstruktur dan perbandingan berdampingan. Tampilan ini membantu Anda mengevaluasi fitur produk dan pendekatan arsitektur. Panduan ini juga memberikan rencana penerapan untuk kasus penggunaan Anda.
Bagian berikut menguraikan praktik terbaik untuk menulis perintah, dan contoh perintah yang dapat Anda gunakan sebelum membuat atau mengubah cluster.
Praktik terbaik untuk perintah
Untuk mendapatkan rekomendasi yang paling akurat dan dapat ditindaklanjuti dari Gemini, sebaiknya susun perintah Anda dengan cara yang sama seperti yang Anda lakukan pada blok kode. Pendekatan ini memandu AI generatif dengan menggunakan deklarasi parameter yang jelas, definisi peran, petunjuk khusus, dan format output eksplisit.
Saat Anda memberikan perintah kepada Gemini, pertimbangkan praktik terbaik berikut:
Berfokus pada desain dan perencanaan: sebaiknya jangan meminta Gemini untuk memecahkan masalah error cluster. Untuk mengatasi error ini, lihat artikel Memecahkan masalah pembuatan, update, dan penghapusan instance komputasi.
Tentukan persona atau peran: nyatakan target peran atau persona, seperti administrator IT, peneliti AI, atau engineer platform, agar Gemini dapat mengadopsinya. Pendekatan ini memandu gaya bahasa, kedalaman, dan tingkat keahlian rekomendasi yang dihasilkan.
Berikan petunjuk bernomor yang jelas: pecah tujuan Anda menjadi pertanyaan atau tugas langkah demi langkah yang konkret. Pendekatan ini menyusun proses penalaran Gemini dan membantu memastikan bahwa Gemini memenuhi semua persyaratan Anda.
Tentukan format output tertentu: nyatakan secara eksplisit format rekomendasi yang Anda inginkan, seperti penjelasan langkah-langkah, tabel perbandingan Markdown, atau blok kode gcloud yang siap digunakan.
Memanfaatkan perujukan konteks otomatis: Anda tidak perlu menyertakan region atau zona default, kuota yang tersedia, CUD, atau batasan lokasi resource ke dalam perintah Anda. Gemini dapat mengakses informasi ini di project Google Cloud Anda.
Memperbaiki desain secara iteratif: Anda dapat mengubah atau memperluas respons yang dihasilkan Gemini dengan mengirimkan perintah baru. Misalnya, Anda dapat meminta asisten untuk menambahkan rekomendasi jaringan ke rencana deployment atau mengubah persyaratan penyimpanan tanpa memulai percakapan baru.
Contoh perintah
Berikut adalah contoh perintah yang dapat Anda gunakan untuk membantu Anda mendesain dan mengoptimalkan cluster:
Topologi cluster dan strategi penempatan: untuk menentukan model deployment dan kebijakan penempatan yang optimal untuk beban kerja AI berperforma tinggi, gunakan perintah seperti berikut:
Act as an AI researcher. I need to design a cluster topology in Cluster Director for training a large language model that balances high accelerator performance with guaranteed capacity. Please provide the following: 1. A side-by-side comparison of deploying A3 Mega VMs across different regions. 2. An explanation of how topology-aware scheduling minimizes network latency. 3. The optimal reservation configuration for this training workload. Format the comparison as a Markdown table, and provide the deployment steps as a ready-to-use gcloud code block.Penyediaan model dan pengoptimalan biaya: untuk mengevaluasi model penyediaan dan mengurangi biaya pemrosesan batch, gunakan perintah seperti berikut:
Act as an IT administrator. I need to find the cheapest way to run large, interruptible batch jobs on our clusters in Cluster Director without risking data loss. Please provide the following: 1. A cost and reliability comparison of standard discounted VMs against Spot VMs. 2. An explanation of how to provision all our compute power at the exact same time. 3. A deployment script that gives our jobs a two-minute warning before a Spot VM gets reclaimed. Format the comparison as a Markdown table, and provide the steps to take in the Google Cloud console.