Sebelum dapat men-deploy cluster pertama di cluster pelatihan Gemini Enterprise Agent Platform, Anda harus mengonfigurasi Google Cloud project dan lingkungan. Panduan ini mencakup semua prasyarat yang diperlukan, yang termasuk dalam tiga kategori utama:
Akses Project: Mendapatkan akses ke layanan, yang hanya berdasarkan undangan.
Konfigurasi Resource: Mengaktifkan API dan menyiapkan layanan penyimpanan dan jaringan VPC yang diperlukan.
Izin Pengguna: Memberikan peran IAM yang diperlukan untuk pengelolaan cluster dan akses resource.
Menyelesaikan langkah-langkah ini akan menyiapkan project Anda untuk deployment yang berhasil.
Prasyarat
Untuk menggunakan cluster pelatihan, Anda harus:
- Izinkan project Anda dengan menghubungi sales representative Anda untuk mendapatkan akses.
- Mendapatkan kapasitas untuk cluster GPU di region yang didukung.
- Mengaktifkan API yang diperlukan, termasuk Compute Engine, Filestore, Cloud Storage, Managed Lustre (opsional), Hypercomputer Configuration Service, dan Agent Platform API.
- Mengonfigurasi jaringan dengan memastikan jaringan yang ada memenuhi kondisi tertentu (misalnya, Akses Pribadi Google, aturan firewall) atau dengan membuat jaringan dan subnetwork VPC baru.
- Mengonfigurasi penyimpanan dengan membuat instance Filestore zonal atau regional
untuk berfungsi sebagai direktori
/homedan secara opsional mengonfigurasi Google Cloud instance Lustre terkelola. - Memberikan izin IAM kepada pengguna untuk pengelolaan cluster, akses penyimpanan, dan akses SSH ke node cluster, seperti yang dijelaskan di bagian izin IAM.
Region yang didukung
us-central1us-east1us-east4us-east5us-south1us-west1us-west4asia-southeast1europe-west1europe-west4europe-north1asia-south2
Izin IAM
- Berikan peran
roles/aiplatform.adminkepada pengguna yang akan mengelola cluster pelatihan Anda. - Berikan peran
roles/aiplatform.viewerkepada pengguna yang hanya perlu melihat cluster dan konfigurasinya. Berikan peran IAM berikut kepada pengguna atau akun layanan yang akan mengelola (membuat, menghapus, dan memperbarui) cluster Pelatihan Terkelola:
Nama Peran ID Peran Compute Instance Admin (v1) roles/compute.instanceAdmin.v1Penulis Log roles/logging.logWriterPenulis Metrik Pemantauan roles/monitoring.metricWriterService Account User roles/iam.serviceAccountUserService Networking Admin roles/servicenetworking.networksAdminUntuk mengizinkan node cluster membaca dari dan menulis ke bucket Cloud Storage menggunakan Google Cloud Storage FUSE, berikan peran Pengguna Objek Penyimpanan (
roles/storage.objectUser) ke akun layanan yang digunakan oleh VM.Untuk akses SSH ke node login Slurm, berikan izin berikut:
Izin Deskripsi Tujuan Login OS Compute Login ke VM sebagai pengguna standar (non-administrator). Jika sudodiperlukan, gunakan Login Admin OS Compute.SSH ke node login yang di-deploy IAP-secured Tunnel User Mengakses resource Tunnel yang menggunakan Identity-Aware Proxy. SSH ke node login yang di-deploy
Mengaktifkan API
Aktifkan Google Compute Engine API:
gcloud services enable compute.googleapis.comAktifkan jaringan layanan karena Filestore harus di-deploy sebelum membuat cluster.
gcloud services enable servicenetworking.googleapis.comAktifkan Cloud Storage API:
gcloud services enable storage.googleapis.comAktifkan Lustre API (jika menggunakan Lustre):
gcloud services enable lustre.googleapis.comAktifkan HCS API:
gcloud services enable hypercomputecluster.googleapis.comAktifkan Gemini Enterprise API:
gcloud services enable aiplatform.googleapis.comAktifkan Cloud Resource Manager API:
gcloud services enable cloudresourcemanager.googleapis.com
Langkah berikutnya
Untuk panduan mendetail tentang cara membuat cluster pelatihan dan menjalankan workload AI/ML, hubungi perwakilan penjualan Anda.