Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Memilih opsi pemakaian

Dokumen ini menjelaskan berbagai cara, yang disebut opsi pemakaian, untuk mendapatkan dan menggunakan resource komputasi di AI Hypercomputer. Pilih opsi yang paling sesuai dengan workload, durasinya, dan kebutuhan biaya Anda.

Setiap opsi konsumsi menentukan hal berikut:

Cara Anda mengakses kapasitas untuk membuat VM atau cluster.
Model penyediaan yang mendasarinya, yang menentukan ketersediaan, masa aktif, dan harga VM Anda.

Perbandingan opsi pemakaian

Tabel berikut merangkum perbedaan utama antara opsi konsumsi:

Opsi pemakaian	Pemesanan untuk masa mendatang di AI Hypercomputer	Pemesanan untuk masa mendatang hingga 90 hari (dalam mode kalender)	Flex-start	Spot
Mesin yang didukung	A4X Max, A4X, A4, A3 Ultra, A3 Mega, atau A3 High	A4, A3 Ultra, A3 Mega, atau A3 High dengan 8 GPU	Mesin GPU apa pun kecuali A4X Max dan A4X	Mesin GPU apa pun kecuali A4X Max dan A4X
Masa aktif	Tidak terbatas	Hingga 90 hari	Hingga 7 hari	Tidak terbatas (tetapi tunduk pada pengambilalihan)
Preemptible
Jaminan kapasitas	Sangat tinggi. Jika Google Cloud menyetujui permintaan pemesanan Anda, maka Anda memiliki jaminan yang sangat tinggi bahwa Compute Engine akan menyediakan kapasitas yang Anda minta.	Sangat tinggi. Jika Google Cloud menyetujui permintaan pemesanan Anda, maka Anda memiliki jaminan yang sangat tinggi bahwa Compute Engine akan menyediakan kapasitas yang Anda minta.	Upaya terbaik. Compute Engine melakukan upaya terbaik untuk menjadwalkan penyediaan kapasitas yang Anda minta.	Upaya terbaik. Compute Engine melakukan upaya terbaik untuk menyediakan kapasitas yang Anda minta.
Kuota	Google Cloud secara otomatis meningkatkan kuota sebelum kapasitas diberikan.	Tidak ada kuota yang digunakan.	Menggunakan kuota preemptible.	Menggunakan kuota preemptible.
Harga	Diskon (hingga 53%). Lihat harga untuk VM yang dioptimalkan akselerator. Jika Anda memesan resource selama satu tahun atau lebih, Anda harus membeli dan melampirkan komitmen berbasis resource ke resource yang Anda pesan. Anda akan ditagih untuk periode reservasi. Lihat penagihan reservasi.	Diskon (hingga 53%). Lihat harga Dynamic Workload Scheduler. Anda akan ditagih untuk periode reservasi. Lihat penagihan reservasi.	Diskon (hingga 53%). Lihat harga Dynamic Workload Scheduler. Anda membayar sesuai penggunaan (PAYG).	Diskon besar (hingga 91%). Lihat harga Spot VM dan harga VM yang dioptimalkan akselerator. Anda membayar sesuai penggunaan (PAYG).
Alokasi resource	Padat	Padat	Padat berdasarkan upaya terbaik ( kebijakan rapat atau kebijakan beban kerja opsional)	Standar (kebijakan compact opsional)
Model penyediaan	Terikat dengan reservasi	Terikat dengan reservasi	Flex-start	Spot
Metode pembuatan	Untuk membuat VM, Anda harus melakukan hal berikut: Pesan kapasitas dengan menghubungi tim akun Anda. Pada tanggal dan waktu yang Anda pilih, Anda dapat menggunakan kapasitas yang dipesan untuk membuat VM dan cluster menggunakan salah satu metode yang dijelaskan dalam Ringkasan opsi deployment.	Untuk membuat VM, Anda harus melakukan hal berikut: Membuat pemesanan untuk masa mendatang dalam mode kalender. Pada tanggal dan waktu yang Anda pilih, Anda dapat menggunakan kapasitas yang telah dipesan untuk membuat VM dan cluster menggunakan salah satu metode yang dijelaskan dalam Ringkasan opsi deployment.	Saat Anda meminta untuk membuat VM mulai fleksibel, Compute Engine akan menjadwalkan pembuatan VM berdasarkan ketersediaan. Saat kapasitas tersedia, Compute Engine akan menyediakan VM mulai fleksibel. Untuk membuat VM mulai fleksibel, gunakan salah satu metode yang dijelaskan dalam Ringkasan opsi deployment.	Anda dapat langsung membuat VM menggunakan salah satu metode yang dijelaskan dalam Ringkasan opsi deployment.

Memilih opsi pemakaian

Gunakan diagram alur berikut untuk memilih opsi konsumsi yang paling sesuai dengan beban kerja Anda:

Diagram alir dengan opsi pemakaian untuk AI Hypercomputer.

Pertanyaan dalam diagram sebelumnya adalah sebagai berikut:

Apakah Anda memerlukan kapasitas selama lebih dari 90 hari?
- Ya: Lihat Menggunakan pemesanan mendatang di AI Hypercomputer.
- Tidak: Lanjutkan ke pertanyaan 2.
Apakah Anda menginginkan kapasitas yang dipesan?
- Ya: Lihat Menggunakan pemesanan untuk masa mendatang dalam mode kalender.
- Tidak: Lanjutkan ke pertanyaan 3.
Apakah beban kerja Anda fault-tolerant?
- Tidak: Lihat Menggunakan Flex-start.
- Ya: Lihat Menggunakan Spot.

Menggunakan reservasi mendatang di AI Hypercomputer

Untuk menjalankan workload terdistribusi skala besar yang berjalan lama dan memerlukan resource yang dialokasikan secara padat, Anda dapat meminta resource komputasi untuk waktu tertentu di masa mendatang. Anda memiliki akses eksklusif ke resource yang dipesan untuk jangka waktu tersebut, dan Anda dapat menggunakan resource tersebut untuk membuat VM atau cluster. Di akhir periode pemesanan, Compute Engine akan melakukan hal berikut:

Compute Engine akan menghapus pemesanan.
Berdasarkan tindakan penghentian yang Anda tentukan untuk VM, Compute Engine akan menghentikan atau menghapus VM apa pun yang menggunakan reservasi.

Workload ideal untuk reservasi mendatang di AI Hypercomputer

Pemesanan untuk masa mendatang ideal untuk workload berikut:

Model dasar pra-pelatihan
Inferensi model dasar multi-host

Karakteristik utama pemesanan untuk masa mendatang di AI Hypercomputer

Pemesanan untuk masa mendatang memiliki karakteristik berikut:

Anda dapat memesan jenis mesin A4X Max, A4X, A4, A3 Ultra, A3 Mega, atau A3 High (8 GPU). Mesin dialokasikan secara padat untuk meminimalkan latensi jaringan.
Anda dapat mencadangkan sejumlah VM untuk durasi berapa pun yang dimulai pada tanggal mendatang. Gunakan resource yang dicadangkan untuk membuat dan menjalankan VM hingga akhir periode reservasi. Jika Anda mencadangkan resource selama satu tahun atau lebih, Anda harus membeli dan melampirkan komitmen berbasis resource.
Setelah periode pemesanan dimulai, Anda dapat mengubah pemesanan yang dibuat secara otomatis sebagai berikut:
- Mengaktifkan atau menonaktifkan notifikasi pemeliharaan darurat hardware
- Mengaktifkan atau menonaktifkan penggunaan tugas Vertex AI
Anda menggunakan model penyediaan terikat reservasi, yang memiliki manfaat berikut:
- Anda memiliki peluang yang lebih besar untuk mendapatkan GPU.
- Selain komitmen yang dilampirkan ke VM, Anda mendapatkan diskon hingga 53% untuk vCPU dan GPU.

Cara menggunakan pemesanan untuk masa mendatang di AI Hypercomputer

Untuk menggunakan reservasi mendatang guna membuat VM atau cluster, Anda harus menyelesaikan langkah-langkah berikut:

Minta untuk mereservasi kapasitas. Anda menghubungi tim akun dan menentukan resource yang akan dipesan. Berdasarkan ketersediaan, Google membuat draf permintaan reservasi untuk Anda. Jika sudah benar, Anda dapat mengirimkannya. Google Cloud langsung menyetujui permintaan pemesanan.

Untuk mengetahui petunjuknya, lihat Mereservasi kapasitas.
Menggunakan resource yang dipesan. Di awal periode pemesanan yang Anda pilih, Anda dapat menggunakan pemesanan untuk membuat VM atau cluster.

Untuk mengetahui berbagai metode pembuatan VM atau cluster, lihat Ringkasan opsi deployment.

Menggunakan pemesanan untuk masa mendatang dalam mode kalender

Untuk menjalankan workload terdistribusi yang berjalan singkat dan memerlukan resource yang dialokasikan secara padat, Anda dapat meminta resource komputasi hingga 90 hari. Anda memiliki akses eksklusif ke resource yang dipesan selama waktu tersebut, dan Anda dapat menggunakan resource untuk membuat VM atau cluster. Di akhir periode reservasi, Compute Engine akan melakukan hal berikut:

Compute Engine akan menghapus pemesanan.
Berdasarkan tindakan penghentian yang Anda tentukan untuk VM, Compute Engine akan menghentikan atau menghapus VM apa pun yang menggunakan reservasi.

Workload ideal untuk pemesanan mendatang dalam mode kalender

Pemesanan untuk masa mendatang dalam mode kalender ideal untuk workload berikut:

Pra-pelatihan model
Penyesuaian model
Simulasi
Inferensi

Karakteristik utama pemesanan untuk masa mendatang dalam mode kalender

Pemesanan untuk masa mendatang dalam mode kalender memiliki karakteristik berikut:

Anda dapat memesan jenis mesin A4, A3 Ultra, A3 Mega, atau A3 High (8 GPU). Mesin ini dialokasikan secara padat untuk meminimalkan latensi jaringan.
Anda dapat melihat ketersediaan di masa mendatang dan mencadangkan hingga 80 VM hingga 90 hari. Kemudian, Anda dapat menggunakan resource yang dipesan untuk membuat VM hingga akhir periode reservasi.
Setelah periode pemesanan dimulai, Anda dapat mengubah pemesanan yang dibuat secara otomatis sebagai berikut:
- Mengaktifkan atau menonaktifkan notifikasi pemeliharaan darurat hardware
- Mengaktifkan atau menonaktifkan penggunaan tugas Vertex AI
Anda menggunakan model penyediaan terikat reservasi, yang memiliki manfaat berikut:
- Anda memiliki peluang yang lebih besar untuk mendapatkan GPU.
- Anda mendapatkan diskon hingga 53% untuk vCPU dan GPU.

Cara menggunakan pemesanan untuk masa mendatang dalam mode kalender

Untuk menggunakan reservasi mendatang dalam mode kalender guna membuat VM atau cluster, Anda harus menyelesaikan langkah-langkah berikut:

Melihat ketersediaan resource. Anda dapat melihat ketersediaan resource yang ingin Anda pesan pada masa mendatang. Saat membuat permintaan pemesanan, Anda dapat menentukan jumlah, jenis, dan durasi pemesanan untuk resource yang Anda konfirmasi ketersediaannya. Tindakan ini meningkatkan peluang Google Cloud menyetujui permintaan Anda.

Untuk mengetahui petunjuknya, lihat Melihat ketersediaan resource di masa mendatang.
Pesan kapasitas. Anda membuat permintaan pemesanan untuk tanggal dan waktu mendatang. Google Cloud menyetujui permintaan pemesanan dalam waktu dua menit. Jika disetujui, Compute Engine akan memesan kapasitas. Pada tanggal pengiriman yang Anda pilih, Anda dapat menggunakan resource yang dipesan untuk membuat VM atau cluster.

Untuk mengetahui petunjuknya, lihat Membuat permintaan reservasi untuk VM GPU atau TPU.
Menggunakan resource yang dipesan. Di awal periode pemesanan yang Anda pilih, Anda dapat menggunakan pemesanan untuk membuat VM atau cluster.

Untuk mengetahui berbagai metode pembuatan VM atau cluster, lihat artikel berikut:
- Untuk membuat VM A4, A3 Ultra, A3 Mega, atau A3 High (8 GPU), lihat Ringkasan opsi deployment.
- Untuk membuat VM A3 Mega atau A3 High (8 GPU) dengan GPUDirect-TCPX diaktifkan, lihat Membuat VM A3 dengan GPUDirect-TCPX diaktifkan.

Menggunakan Flex-start

Untuk menjalankan workload berdurasi singkat yang memerlukan resource yang dialokasikan secara padat, Anda dapat meminta resource komputasi hingga tujuh hari menggunakan flex-start. Setiap kali resource tersedia, Compute Engine akan membuat VM dalam jumlah yang Anda minta. Anda dapat menghentikan VM Flex-start mandiri, tetapi Anda tidak dapat menghentikan VM Flex-start yang dibuat oleh grup instance terkelola (MIG) melalui permintaan pengubahan ukuran. VM mulai fleksibel akan ada hingga Anda menghapusnya, atau hingga Compute Engine menghapus VM di akhir durasi jalannya.

Workload ideal untuk Flex-start

Flex-start ideal untuk workload yang dapat dimulai kapan saja, seperti berikut:

Pra-pelatihan model kecil
Penyesuaian model
Simulasi
Inferensi batch

Karakteristik utama Flex-start

flex-start memiliki karakteristik berikut:

Anda dapat meminta jenis mesin GPU apa pun, kecuali A4X Max dan A4X. Compute Engine melakukan upaya terbaik untuk mengalokasikan mesin secara padat, yang dapat menyebabkan VM mulai fleksibel berjauhan dalam zona yang sama. Untuk mengontrol penempatan VM dan meminimalkan latensi jaringan, Anda dapat melakukan hal berikut:
- Untuk VM Flex-start mandiri, terapkan kebijakan penempatan rapat ke VM.
- Untuk MIG dengan ukuran target, terapkan kebijakan workload.
Anda menggunakan model penyediaan flex-start, yang memiliki manfaat berikut:
- Anda memiliki peluang yang lebih besar untuk mendapatkan GPU.
- Anda mendapatkan diskon hingga 53% untuk vCPU, memori, dan GPU.

Cara menggunakan Flex-start

Untuk menggunakan flex-start guna membuat VM atau cluster, Anda harus menyelesaikan langkah-langkah berikut:

Opsional: Buat kebijakan penempatan ringkas atau kebijakan beban kerja. Anda dapat membuat kebijakan penempatan ringkas (untuk VM mandiri atau VM secara massal) atau kebijakan beban kerja (untuk MIG) untuk menentukan kedekatan VM. Konfigurasi yang Anda pilih memengaruhi jenis mesin dan jumlah VM yang didukung kebijakan.
Buat VM dengan mulai fleksibel. Setelah Anda meminta untuk membuat VM, Compute Engine menjadwalkan pembuatan VM berdasarkan ketersediaan. Saat kapasitas tersedia, Compute Engine akan menyediakan VM dengan mulai fleksibel. VM berjalan hingga Anda menghentikan atau menghapusnya, atau hingga VM mencapai akhir durasi berjalannya.

Untuk mengetahui petunjuknya, lihat Ringkasan opsi deployment.

Menggunakan Spot

Untuk menjalankan workload fault-tolerant, Anda bisa mendapatkan resource komputasi secara langsung berdasarkan ketersediaan. Anda mendapatkan resource dengan harga serendah mungkin. Namun, Compute Engine dapat melakukan preempt VM kapan saja untuk memulihkan kapasitas.

Workload ideal untuk Spot

Spot ideal untuk workload yang dapat menoleransi gangguan, seperti berikut:

Batch processing
Komputasi berperforma tinggi (HPC)
Continuous integration dan continuous deployment (CI/CD)
Analisis data
Encoding media
Inferensi online

Karakteristik utama Spot

Spot memiliki karakteristik berikut:

Anda dapat membuat jenis mesin GPU apa pun, kecuali A4X Max dan A4X. Alokasi padat bergantung pada ketersediaan resource. Untuk membantu memastikan alokasi yang lebih dekat, Anda dapat menerapkan kebijakan penempatan rapat ke VM.
Anda dapat membuat VM dengan seketika. VM berjalan hingga Anda menghentikan atau menghapusnya, atau hingga Compute Engine melakukan preempt terhadap VM untuk memulihkan kapasitas.
Anda menggunakan model penyediaan spot, yang memiliki manfaat berikut:
- Anda memiliki peluang yang lebih besar untuk mendapatkan GPU.
- Anda mendapatkan diskon hingga 91% untuk banyak jenis mesin, GPU, TPU, dan disk SSD Lokal.

Cara menggunakan Spot

Untuk menggunakan Spot guna membuat VM atau cluster, Anda harus menyelesaikan langkah-langkah berikut:

Melihat ketersediaan resource. Anda dapat melihat ketersediaan resource di region atau zona tempat Anda ingin membuat VM Spot. Tindakan ini membantu mengurangi kemungkinan Anda mengalami error ketersediaan resource.

Untuk mengetahui petunjuknya, lihat Melihat ketersediaan Spot VM.
Opsional: Lihat tarif dan harga penghentian sementara. Anda dapat melihat tarif dan tingkat preempti historis dan saat ini di berbagai jenis mesin dan zona. Informasi ini membantu Anda memilih jenis dan lokasi mesin yang paling sesuai dengan workload dan anggaran Anda.

Untuk mengetahui petunjuknya, lihat Melihat tarif preempti dan harga untuk Spot VM.
Opsional: Buat kebijakan penempatan ringkas atau kebijakan beban kerja. Anda dapat membuat kebijakan penempatan ringkas (untuk VM mandiri atau VM secara massal) atau kebijakan beban kerja (untuk MIG) untuk menentukan kedekatan VM. Konfigurasi yang Anda pilih memengaruhi jenis mesin dan jumlah VM yang didukung kebijakan.

Untuk mengetahui petunjuknya, lihat Mengurangi latensi dengan menggunakan kebijakan penempatan ringkas atau Membuat kebijakan workload untuk MIG.
Buat Spot VM. Anda dapat membuat VM sebanyak yang Anda inginkan, berdasarkan ketersediaan. VM berjalan hingga Anda menghentikan atau menghapusnya, atau hingga Compute Engine melakukan preempt terhadap VM untuk memulihkan kapasitas.

Untuk mengetahui petunjuknya, lihat Ringkasan opsi deployment.

Memilih opsi pemakaian Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Perbandingan opsi pemakaian

Memilih opsi pemakaian

Menggunakan reservasi mendatang di AI Hypercomputer

Workload ideal untuk reservasi mendatang di AI Hypercomputer

Karakteristik utama pemesanan untuk masa mendatang di AI Hypercomputer

Cara menggunakan pemesanan untuk masa mendatang di AI Hypercomputer

Menggunakan pemesanan untuk masa mendatang dalam mode kalender

Workload ideal untuk pemesanan mendatang dalam mode kalender

Karakteristik utama pemesanan untuk masa mendatang dalam mode kalender

Cara menggunakan pemesanan untuk masa mendatang dalam mode kalender

Menggunakan Flex-start

Workload ideal untuk Flex-start

Karakteristik utama Flex-start

Cara menggunakan Flex-start

Menggunakan Spot

Workload ideal untuk Spot

Karakteristik utama Spot

Cara menggunakan Spot

Memilih opsi pemakaian