Ce document présente et compare les stratégies d'emplacement compact et les stratégies de charge de travail. Ces deux stratégies vous permettent de configurer l'emplacement des instances de machines virtuelles (VM) pour minimiser la latence réseau. Utilisez des stratégies d'emplacement compact pour les instances créées individuellement ou de manière groupée, et des stratégies de charge de travail pour les groupes d'instances gérés (MIG).
Par défaut, vous ne gérez l'emplacement de vos VM qu'en spécifiant leurs zones. Lorsque vous utilisez des réservations futures ou le démarrage flexible avec des demandes de redimensionnement de MIG pour obtenir des machines A4X, A4, A3 Ultra, A3 Mega et A3 High (8 GPU), les ressources de VM que vous recevez sont densément colocalisées par défaut. Toutefois, vous pouvez placer des VM spécifiques plus près les unes des autres pour optimiser les performances entre les VM dans chaque application. Pour rapprocher les VM, vous pouvez appliquer des stratégies d'emplacement compact aux VM ou des stratégies de charges de travail à haut débit aux MIG.
Stratégie d'emplacement compact pour les VM
Lorsque vous appliquez des stratégies de concentration à vos VM, Compute Engine s'efforce de les créer aussi près les unes des autres que possible. Si votre application est sensible à la latence et que vous souhaitez que les VM soient aussi proches les unes des autres que possible (compacité maximale), spécifiez le champ maxDistance (aperçu) lorsque vous créez une stratégie de concentration.
Pour en savoir plus, consultez À propos des stratégies d'emplacement compact dans la documentation Compute Engine.
Règle de charge de travail pour les MIG
Une règle de charge de travail vous permet de spécifier le type de charge de travail que vous souhaitez exécuter sur votre infrastructure. Vous pouvez également spécifier les propriétés physiques de l'infrastructure sous-jacente, telles que l'emplacement de la VM, pour qu'elles correspondent au mieux au type spécifié.
Vous définissez les paramètres de configuration suivants pour une règle de charge de travail :
Type de charge de travail (
type) : pour les charges de travail à haut débit (high-throughput), Compute Engine s'efforce de placer les VM le plus près possible les unes des autres. L'emplacement des VM dépend du type de machine et de la disponibilité des zones des VM.Exigence supplémentaire pour utiliser la colocation stricte ou la topologie d'accélérateur des VM. Vous pouvez spécifier l'une des options suivantes :
Colocation stricte des VM (
maxTopologyDistance) : pour obtenir des performances réseau précises et à faible latence. Une colocation stricte signifie qu'en plus de faire de notre mieux pour placer vos VM le plus près possible les unes des autres, vous pouvez spécifier la distance maximale entre les VM. Si l'exigence de colocation stricte n'est pas respectée en raison de contraintes de capacité, le MIG ne crée pas les VM.Topologie d'accélérateur des VM (
acceleratorTopology) : pour obtenir des performances élevées pour les charges de travail distribuées qui s'exécutent sur plusieurs VM utilisant une configuration réseau inter-accélérateur spécialisée (par exemple, les VM A4X qui utilisent des domaines NVLink pour les GPU).
Comparaison entre la stratégie d'emplacement compact et la stratégie de charge de travail
Le tableau suivant récapitule les différences entre les règles de placement compact et les règles de charge de travail :
| Règle d'emplacement de concentration | Règle de charge de travail | |
|---|---|---|
| À utiliser avec ces ressources |
|
Groupes d'instances gérés (MIG) |
| Types de machines compatibles | Toutes les familles de GPU | A4X, A4, A3 Ultra, A3 Mega et A3 High (8 GPU) |
| Sémantique de regroupement | Compute Engine place les instances qui utilisent la même stratégie d'emplacement compact plus près les unes des autres. Nous vous recommandons d'utiliser une stratégie d'emplacement différente pour chaque charge de travail. Si vous réutilisez une stratégie d'emplacement sur des instances qui exécutent différentes charges de travail, toutes ces instances seront placées ensemble. Cette colocation peut rendre difficile la création d'instances proches les unes des autres lorsque vous effectuer un scaling horizontal d'une charge de travail spécifique. |
Compute Engine place les instances d'un MIG qui utilise une stratégie de charge de travail plus près les unes des autres. Si vous réutilisez une stratégie de charge de travail sur plusieurs MIG qui exécutent différentes charges de travail, les instances sont regroupées dans des MIG individuels. La réutilisation est idéale pour les grands modèles d'entraînement dans lesquels chaque groupe d'instances doit être isolé des autres. |
| Configuration de la colocation de VM | Pour la colocation de VM au mieux, définissez le champ |
Pour la colocation de VM au mieux, définissez le champ |
| Configurations supplémentaires |
|
|
Comparaison des valeurs de distance maximale
Une valeur de distance maximale plus faible garantit un placement plus proche des VM, mais augmente également le risque que certaines VM ne soient pas créées.
Le tableau suivant indique la série de machines et le nombre de VM compatibles avec chaque valeur de distance maximale :
maxDistance dans une règle de concentration |
maxTopologyDistance dans une règle de charge de travail |
Description | Série de machines compatible | Nombre maximal de VM |
|---|---|---|---|---|
| Non spécifié (non recommandé) | Non spécifié (non recommandé) | Compute Engine s'efforce de placer les VM le plus près possible les unes des autres, sans distance maximale entre elles. | A4, A3 Ultra, A3 Mega, A3 High (8 GPU) | 1500 |
3 |
cluster |
Compute Engine crée des VM dans des blocs adjacents. | A4 | 1 500 |
2 |
block |
Compute Engine crée des VM dans le même bloc. | A4 et A3 Ultra |
|