Terminología

La siguiente terminología se usa a menudo cuando se trabaja con AI Hypercomputer.

Bloquear a
Es una colección de subbloques interconectados con una estructura no bloqueante, que proporciona conectividad de ancho de banda alto entre todos los hosts.

Clúster
Una colección de bloques interconectados por una estructura de red de alta velocidad. Cada clúster es único a nivel global. En el caso de las máquinas A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), un clúster proporciona una estructura de red común y sin bloqueos para tus bloques de capacidad del acelerador. Dentro de un clúster, la red de este a oeste no bloquea toda la colección de bloques.

Implementación densa
Una solicitud de recursos que asigna tus recursos de acelerador físicamente cerca unos de otros para minimizar los saltos de red y optimizar la latencia más baja.

Estructura de red
Una estructura de red proporciona conectividad de baja latencia y ancho de banda alto en todos los bloques y servicios Google Cloud de un clúster. Jupiter es la arquitectura de red de los centros de datos de Google que usa red definida por software y conmutadores de circuitos ópticos para evolucionar la red y optimizar su rendimiento.

Nodo o host
Una sola máquina de servidor física en el centro de datos. Cada host tiene recursos de procesamiento asociados, como aceleradores. La cantidad y la configuración de estos recursos de procesamiento dependen de la familia de máquinas. Las instancias de Compute Engine se aprovisionan sobre un host físico.

Un dominio de NVLink, también conocido como subbloque, es la unidad central de capacidad para las máquinas A4X Max y A4X. Un dominio de NVLink consta de 18 instancias de A4X Max o A4X (72 GPUs) que están conectadas por un sistema NVLink de varios nodos.

Subbloque
Un grupo de hosts y hardware de conectividad asociado que se encuentran en un solo rack físico. En el contexto de las máquinas A4X Max y A4X, un subbloque también se conoce como dominio NVLink.

Más información

En los siguientes documentos, se proporcionan más explicaciones sobre las terminologías que son relevantes para los temas correspondientes: