Membuat template runtime
Halaman ini menunjukkan cara membuat template runtime di Colab Enterprise.
Untuk menjalankan kode di notebook, gunakan resource komputasi yang disebut runtime. Anda dapat menggunakan runtime default atau runtime yang dibuat dari template runtime. Dengan membuat template runtime, Anda dapat mengonfigurasi template untuk mengoptimalkan performa, biaya, dan karakteristik runtime lainnya berdasarkan kebutuhan Anda.
Pelajari runtime dan template runtime lebih lanjut.
Sebelum memulai
- Login keakun Anda. Google Cloud Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Vertex AI, Dataform, and Compute Engine APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Vertex AI, Dataform, and Compute Engine APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat template runtime di Colab Enterprise, minta administrator Anda untuk memberi Anda peran IAM Colab Enterprise Admin (roles/aiplatform.colabEnterpriseAdmin) di project tersebut.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuat template runtime
Untuk membuat template runtime, Anda dapat menggunakan Google Cloud konsol, Google Cloud CLI, REST API, atau Terraform.
Konsol
Untuk membuat template runtime:
-
Di Google Cloud konsol, buka halaman Colab Enterprise Runtime templates.
-
Klik New template.
Dialog Create new runtime template akan muncul.
Dasar-dasar runtime
-
Di bagian Runtime basics, masukkan Display name.
-
Di menu Region, pilih region tempat Anda ingin template runtime.
-
Opsional: Tambahkan Deskripsi dari template runtime Anda.
-
Opsional: Untuk menambahkan label, klik Tambahkan label, lalu masukkan pasangan Kunci dan Nilai singkat ini. Untuk menambahkan label lainnya, ulangi langkah ini.
-
Klik Lanjutkan.
Mengonfigurasikan komputasi
-
Di bagian Configure compute, pada menu Machine type, pilih jenis mesin. Untuk informasi tentang jenis mesin, lihat Panduan perbandingan dan resource kelompok mesin.
Jika Anda memilih jenis mesin yang memiliki GPU, pilih Accelerator type dan Accelerator count. Jika Anda tidak dapat memilih jumlah GPU yang diinginkan, Anda mungkin perlu meningkatkan kuota. Lihat Meminta penyesuaian kuota.
-
Di menu Data disk type, pilih jenis disk.
-
Di kolom Data disk size, masukkan ukuran dalam GB.
-
Di bagian Idle shutdown:
-
Untuk menonaktifkan penonaktifan tidak ada aktivitas, hapus opsi Enable idle shutdown.
-
Untuk mengubah jangka waktu tidak aktif, di Time of inactivity before shutdown (Minutes), ubah angka ke jumlah menit tidak aktif yang Anda inginkan. Di Google Cloud konsol, setelan ini dapat disetel ke nilai bilangan bulat apa pun dari 10 hingga 1440.
-
-
Klik Lanjutkan.
Lingkungan
-
Di bagian Environment, pilih Environment. Defaultnya adalah Latest (saat ini Python 3.12).
-
Opsional: Di kolom Post-startup script, masukkan URI untuk skrip pasca-startup. Untuk mengetahui informasi selengkapnya tentang penggunaan skrip pasca-startup, lihat Menggunakan skrip pasca-startup.
-
Opsional: Di bagian URL skrip pasca-startup, pilih perilaku skrip pasca-startup Anda. Perilaku defaultnya adalah Run once. Untuk mengetahui informasi selengkapnya, lihat Perilaku skrip pasca-startup.
-
Opsional: Untuk menambahkan variabel lingkungan, klik Tambahkan variabel lingkungan, lalu masukkan pasangan Kunci dan Nilai. Untuk menambahkan variabel lingkungan lainnya, ulangi langkah ini.
-
Klik Lanjutkan.
Jaringan dan keamanan
-
Di bagian Networking and security, pada menu Network, pilih jaringan. Jika Anda tidak memilih jaringan, jaringan default akan dipilih.
-
Pada menu Subnetwork, pilih subnetwork.
-
Untuk menonaktifkan akses internet publik, hapus opsi Aktifkan akses internet publik.
-
Untuk menonaktifkan akses kredensial pengguna akhir, hapus centang Enable end-user credentials.
Menyelesaikan pembuatan template runtime
Klik Create untuk menyelesaikan pembuatan template runtime.
Template runtime Anda akan muncul dalam daftar di tab Runtime templates.
gcloud
Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:
DISPLAY_NAME: nama tampilan template runtime Anda.PROJECT_ID: project ID Anda.REGION: region tempat Anda ingin template runtime.-
MACHINE_TYPE: jenis mesin yang akan digunakan untuk runtime Anda. ACCELERATOR_TYPE: jenis akselerator hardware yang akan digunakan untuk runtime Anda.ACCELERATOR_COUNT: jumlah akselerator yang akan digunakan untuk runtime Anda.
Jalankan perintah berikut:
Linux, macOS, atau Cloud Shell
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \ --project=PROJECT_ID \ --region=REGION \ --machine-type=MACHINE_TYPE \ --accelerator-type=ACCELERATOR_TYPE \ --accelerator-count=ACCELERATOR_COUNT
Windows (PowerShell)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ` --project=PROJECT_ID ` --region=REGION ` --machine-type=MACHINE_TYPE ` --accelerator-type=ACCELERATOR_TYPE ` --accelerator-count=ACCELERATOR_COUNT
Windows (cmd.exe)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^ --project=PROJECT_ID ^ --region=REGION ^ --machine-type=MACHINE_TYPE ^ --accelerator-type=ACCELERATOR_TYPE ^ --accelerator-count=ACCELERATOR_COUNT
Untuk mengetahui informasi selengkapnya tentang perintah untuk membuat template runtime dari command line, lihat dokumentasi gcloud CLI.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
REGION: region tempat Anda ingin template runtime.PROJECT_ID: project ID Anda.DISPLAY_NAME: nama tampilan template runtime Anda.-
MACHINE_TYPE: jenis mesin yang akan digunakan untuk runtime Anda. ACCELERATOR_TYPE: jenis akselerator hardware yang akan digunakan untuk runtime Anda.ACCELERATOR_COUNT: jumlah akselerator yang akan digunakan untuk runtime Anda.
Metode HTTP dan URL:
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates
Meminta isi JSON:
{
"displayName": "DISPLAY_NAME",
"machineSpec": {
{
"machineType": MACHINE_TYPE
"acceleratorType": ACCELERATOR_TYPE,
"acceleratorCount": ACCELERATOR_COUNT,
}
},
}
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"
PowerShell
Simpan isi permintaan dalam file bernama request.json,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content
Untuk mengetahui informasi selengkapnya, lihat dokumentasi REST API notebookRuntimeTemplates.create.
Terraform
Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform. Untuk mengetahui informasi selengkapnya, lihat Terraform dokumentasi referensi penyedia.
Contoh berikut menggunakan
google_colab_runtime_template
resource Terraform untuk membuat template runtime Colab Enterprise
Memberikan akses ke template runtime
Setelah membuat template runtime, Anda harus memberikan akses ke template tersebut agar akun utama dapat menggunakannya. Akun utama dapat membuat runtime dari template runtime hanya jika memiliki hal berikut:
- Akses ke template runtime.
- Izin yang diperlukan untuk membuat runtime.
Lihat Mengelola akses ke template runtime.
Menggunakan Colab Enterprise di jaringan VPC Bersama
Saat membuat template runtime atau runtime di project layanan jaringan VPC Bersama, Anda harus memberikan izin tertentu kepada agen layanan Vertex AI
(service-SERVICE_PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com)
di project host. Izin ini digunakan untuk melakukan hal berikut:
- Memvalidasi keberadaan dan aksesibilitas jaringan dan subnetwork Anda saat membuat template runtime.
- Menyediakan instance VM Compute Engine yang mendasarinya dalam jaringan VPC Bersama saat Anda membuat runtime.
Untuk memastikan bahwa agen layanan Vertex AI memiliki izin yang diperlukan untuk mengaktifkan penggunaan template runtime dan runtime dalam jaringan VPC Bersama, minta administrator Anda untuk memberikan peran IAM Compute Network User (roles/compute.networkUser) kepada agen layanan Vertex AI di project host.
Administrator Anda mungkin juga dapat memberikan izin yang diperlukan kepada agen layanan Vertex AI melalui peran khusus atau peran bawaan lainnya.
Menjadwalkan menjalankan notebook di jaringan VPC Bersama
Jika ingin menggunakan penjadwal notebook dengan template runtime atau runtime
di project layanan jaringan VPC Bersama, Anda harus memberikan izin tertentu kepada
agen layanan Colab Enterprise
(service-SERVICE_PROJECT_NUMBER@gcp-sa-vertex-nb.iam.gserviceaccount.com)
di project host. Izin ini digunakan untuk membuat VM Compute Engine yang mendasarinya.
Untuk memastikan bahwa agen layanan Colab Enterprise memiliki izin yang diperlukan untuk menggunakan notebook terjadwal dalam jaringan VPC Bersama, minta administrator Anda untuk memberikan peran IAM Compute Network User (roles/compute.networkUser) kepada agen layanan Colab Enterprise di project host.
Administrator Anda mungkin juga dapat memberikan izin yang diperlukan kepada agen layanan Colab Enterprise melalui peran khusus atau peran bawaan lainnya.
Menghapus template runtime
Untuk menghapus template runtime:
-
Di Google Cloud konsol, buka halaman Colab Enterprise Runtime templates.
-
Di menu Region, pilih region yang berisi template runtime Anda.
-
Pilih template runtime yang ingin dihapus.
-
Klik Delete.
-
Klik Confirm.
Memecahkan masalah
Bagian ini menjelaskan cara menyelesaikan masalah terkait pembuatan template runtime di Colab Enterprise.
Tidak dapat memilih GPU yang cukup
Saat membuat template runtime, Anda tidak dapat memilih jumlah GPU yang diinginkan. Hal ini mungkin karena Anda tidak memiliki kuota yang cukup.
Colab Enterprise menggunakan kuota Compute Engine untuk GPU. Untuk mengetahui informasi selengkapnya, lihat ringkasan kuota dan batas Compute Engine.
Untuk mengatasi masalah ini, Minta penyesuaian kuota.
Langkah berikutnya
- Pelajari runtime dan template runtime lebih lanjut.
- Pelajari cara membuat runtime berdasarkan template runtime.