Zona AI

Dokumen ini memberikan ringkasan zona AI untuk Cloud Storage. Zona AI adalah zona Google Cloud khusus yang dirancang untuk menawarkan kapasitas komputasi untuk workload kecerdasan buatan (AI) dan machine learning (ML). Mereka menyediakan kapasitas akselerator ML (GPU dan TPU) yang signifikan.

Zona AI dioptimalkan untuk workload AI dan ML seperti berikut:

  • Pelatihan skala besar
  • Pelatihan, penyesuaian, inferensi massal, dan pelatihan ulang skala kecil
  • Inferensi ML real-time

Untuk mengetahui informasi latar belakang tentang zona AI, lihat Zona AI dalam dokumentasi Compute Engine.

Dalam suatu region, zona AI mungkin berlokasi secara geografis jauh dari zona standar (non-AI).

Zona AI kompatibel dengan fitur dan Cloud Storage lainnya. Google Cloud

Rekomendasi arsitektur penyimpanan

Sebaiknya gunakan arsitektur penyimpanan bertingkat untuk menyeimbangkan biaya, daya tahan, dan performa:

  • Lapisan penyimpanan dingin: gunakan bucket Cloud Storage regional di zona standar untuk penyimpanan yang persisten dan sangat tahan lama (sumber tepercaya) set data pelatihan dan titik pemeriksaan model Anda.

  • Lapisan performa: gunakan layanan penyimpanan zonal khusus untuk bertindak sebagai cache berkecepatan tinggi atau ruang scratch sementara. Pendekatan ini menghilangkan latensi antar-zona dan memaksimalkan throughput selama tugas aktif.

Solusi penyimpanan berikut direkomendasikan untuk mengoptimalkan performa sistem AI dan ML dengan zona AI:

Layanan penyimpanan Deskripsi Kasus penggunaan
Fitur Anywhere Cache dari Cloud Storage

Cache baca zonal yang didukung SSD dan terkelola sepenuhnya yang membawa data yang sering dibaca dari bucket ke zona AI.

Buat instance Anywhere Cache di zona AI untuk bucket sumber regional yang berisi set data atau model pelatihan yang ingin Anda sajikan. Saat tugas pelatihan Anda membaca file, file tersebut akan ditarik ke cache dalam zona yang cepat. Pembacaan berikutnya akan disalurkan langsung dari cache, melewati jaringan regional. Hal ini ideal untuk pola akses data berulang dalam pelatihan model dan untuk penayangan model latensi rendah.

Direkomendasikan untuk:

  • Workload baca berat
  • Pelatihan dan inferensi model latensi rendah

Tidak direkomendasikan untuk:

  • Aplikasi yang memerlukan kepatuhan POSIX penuh

Praktik terbaik

Ikuti praktik terbaik penyimpanan berikut saat menggunakan zona AI:

  • Sediakan lapisan performa Anda di zona AI yang sama dengan resource komputasi Anda. Menempatkan komputasi dan penyimpanan secara bersamaan membantu memastikan GPU dan TPU tetap sepenuhnya jenuh, sehingga memaksimalkan "goodput" (throughput yang berguna).

  • Untuk Anywhere Cache, sebelum Anda memulai epoch pelatihan utama, lakukan pra-baca set data Anda untuk mengisi, atau melakukan prapenyiapan, cache yang didukung SSD.

Zona AI yang tersedia

Tabel berikut menunjukkan zona AI dan region induknya. Google Cloud

Area geografis Wilayah induk Zona AI
Amerika Serikat us-south1 us-south1-ai1b

Pertimbangan

  • Anda dapat mengakses produk Google Cloud di region Google Cloud dari zona AI region tersebut. Google Cloud Namun, mengakses layanan di region Google Cloud dari zona AI dapat menambah latensi jaringan, karena lokasi zona AI mungkin terpisah secara fisik dari lokasi zona standar region.

  • Sebaiknya jalankan workload non-ML di zona standar, bukan zona AI, karena zona AI tidak menawarkan semua layanan secara lokal. Google Cloud

Langkah berikutnya