Ce document présente les zones d'IA pour Cloud Storage. Les zones d'IA sont des zones Google Cloud spécialisées conçues pour offrir une capacité de calcul pour les charges de travail d'intelligence artificielle (IA) et de machine learning (ML). Elles offrent une capacité d'accélérateur de ML (GPU et TPU) importante.
Les zones d'IA sont optimisées pour les charges de travail d'IA et de ML, comme les suivantes :
- Entraînement à grande échelle
- Entraînement, affinage, inférence par lot et réentraînement à petite échelle
- Inférence ML en temps réel
Pour en savoir plus sur les zones d'IA, consultez Zones d'IA dans la documentation Compute Engine.
Dans une région, les zones d'IA peuvent être géographiquement éloignées des zones standards (non liées à l'IA).
Les zones d'IA sont compatibles avec d'autres fonctionnalités Cloud Storage et Google Cloud.
Recommandations concernant l'architecture de stockage
Nous vous recommandons d'utiliser une architecture de stockage par niveaux pour équilibrer les coûts, la durabilité et les performances :
Couche de stockage froid : utilisez des buckets Cloud Storage régionaux dans des zones standards pour un stockage persistant et très durable (la "source de vérité") de vos ensembles de données d'entraînement et de vos points de contrôle de modèle.
Couche de performances : utilisez des services de stockage zonal spécialisés pour servir de cache haute vitesse ou d'espace de travail temporaire. Cette approche élimine la latence entre les zones et maximise le débit pendant les jobs actifs.
Les solutions de stockage suivantes sont recommandées pour optimiser les performances du système d'IA et de ML avec les zones d'IA :
| Service de stockage | Description | Cas d'utilisation |
|---|---|---|
| Fonctionnalité Anywhere Cache de Cloud Storage |
Cache de lecture zonal entièrement géré et basé sur un disque SSD qui transfère les données fréquemment lues d'un bucket vers la zone d'IA. Créez une instance Anywhere Cache dans une zone d'IA pour le bucket source régional contenant les ensembles de données ou les modèles d'entraînement que vous souhaitez diffuser. Lorsque votre tâche d'entraînement lit un fichier, celui-ci est extrait dans le cache rapide de la zone. Les lectures suivantes sont diffusées directement à partir du cache, en contournant le réseau régional. Il est idéal pour les schémas d'accès aux données répétitifs lors de l'entraînement des modèles et pour le service de modèles à faible latence. |
Recommandé pour :
Il n'est pas recommandé pour :
|
Bonnes pratiques
Suivez ces bonnes pratiques de stockage lorsque vous utilisez des zones d'IA :
Provisionnez votre couche de performances dans la même zone d'IA que vos ressources de calcul. La colocation du calcul et du stockage permet de s'assurer que les GPU et les TPU restent entièrement saturés, ce qui maximise le "goodput" (débit utile).
Pour Anywhere Cache, avant de commencer l'époque d'entraînement principale, effectuez une prélecture de votre ensemble de données pour remplir ou préchauffer le cache basé sur SSD.
Zones d'IA disponibles
Le tableau suivant présente les zones d'IA et leurs régions parentes Google Cloud.
| Zone géographique | Région parente | Zone d'IA |
|---|---|---|
| États-Unis | us-south1 |
us-south1-ai1b |
Remarques
Vous pouvez accéder aux produits Google Cloud dans une région Google Cloud depuis la zone d'IA de la région. Toutefois, l'accès aux services dans une région Google Cloudà partir d'une zone d'IA peut ajouter de la latence réseau, car l'emplacement de la zone d'IA peut être physiquement distinct de celui des zones standards de la région.
Nous vous recommandons d'exécuter les charges de travail non liées au ML dans des zones standards, et non dans des zones d'IA, car ces dernières n'offrent pas tous les services Google Cloud localement.
Étape suivante
- Créez un bucket.
- En savoir plus sur Anywhere Cache
- En savoir plus sur les emplacements des buckets Cloud Storage
- Consultez les conseils de conception du centre d'architecture pour les charges de travail d'IA et de ML.