Terminologi

Terminologi berikut sering digunakan saat bekerja dengan AI Hypercomputer.

Blokir
Kumpulan sub-blok yang saling terhubung dengan fabric non-blocking, yang menyediakan konektivitas berbandwidth tinggi di antara semua host.

Cluster
Kumpulan blok yang saling terhubung oleh fabric jaringan berkecepatan tinggi. Setiap cluster bersifat unik secara global. Untuk mesin A4X, A4, A3 Ultra, A3 Mega, dan A3 High (8 GPU), cluster menyediakan fabric jaringan umum yang tidak memblokir untuk blok kapasitas akselerator Anda. Dalam cluster, jaringan timur ke barat tidak memblokir seluruh kumpulan blok.

Deployment padat
Permintaan resource yang mengalokasikan resource akselerator Anda secara fisik berdekatan satu sama lain untuk meminimalkan hop jaringan dan mengoptimalkan latensi terendah.

Fabric jaringan
Fabric jaringan menyediakan konektivitas berlatensi rendah dan bandwidth tinggi di semua blok dan layanan dalam cluster. Google Cloud Jupiter adalah arsitektur jaringan pusat data Google yang menggunakan jaringan yang ditetapkan untuk software dan switch sirkuit optik untuk mengembangkan jaringan dan mengoptimalkan performanya.

Node atau host
Satu mesin server fisik di pusat data. Setiap host memiliki resource komputasi terkait, seperti akselerator. Jumlah dan konfigurasi resource komputasi ini bergantung pada kelompok mesin. Instance Compute Engine disediakan di atas host fisik.

Domain NVLink, yang juga disebut sebagai sub-blok, adalah unit inti kapasitas untuk mesin A4X Max dan A4X. Domain NVLink terdiri dari 18 instance A4X Max atau A4X (72 GPU) yang terhubung oleh sistem NVLink multi-node.

Sub-blok
Sekelompok host dan hardware konektivitas terkait yang berada di rak fisik tunggal. Dalam konteks mesin A4X Max dan A4X, sub-blok juga disebut sebagai domain NVLink.

Informasi selengkapnya

Dokumen berikut memberikan penjelasan lebih lanjut tentang terminologi yang relevan dengan topik terkait: