Zonas de IA

En este documento, se proporciona una descripción general de las zonas de IA para Cloud Storage. Las zonas de IA son zonas especializadas Google Cloud diseñadas para ofrecer capacidad de procesamiento para cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (AA). Proporcionan una capacidad significativa de acelerador de AA (GPU y TPU).

Las zonas de IA están optimizadas para cargas de trabajo de IA y AA, como las siguientes:

  • Entrenamiento a gran escala
  • Entrenamiento a pequeña escala, ajuste, inferencia masiva y reentrenamiento
  • Inferencia de AA en tiempo real

Para obtener información general sobre las zonas de IA, consulta Zonas de IA en la documentación de Compute Engine.

Dentro de una región, las zonas de IA pueden ubicarse geográficamente lejos de las zonas estándar (no de IA).

Las zonas de IA son compatibles con otras funciones y servicios de Cloud Storage y Google Cloud

Recomendaciones de arquitectura de almacenamiento

Te recomendamos que uses una arquitectura de almacenamiento por niveles para equilibrar el costo, la durabilidad y el rendimiento:

  • Capa de almacenamiento en frío: Usa buckets regionales de Cloud Storage en zonas estándar para el almacenamiento persistente y altamente duradero (la "fuente de información") de tus conjuntos de datos de entrenamiento y puntos de control de modelos.

  • Capa de rendimiento: Usa servicios de almacenamiento zonales especializados para que actúen como una caché de alta velocidad o un espacio provisorio temporal. Este enfoque elimina la latencia entre zonas y maximiza el rendimiento durante los trabajos activos.

Se recomiendan las siguientes soluciones de almacenamiento para optimizar el rendimiento del sistema de IA y AA con zonas de IA:

Servicio de almacenamiento Descripción Casos de uso
Rapid Cache función de Cloud Storage

Una caché de lectura zonal completamente administrada y respaldada por SSD que lleva los datos que se leen con frecuencia de un bucket a la zona de IA.

Crea una instancia de Rapid Cache en una zona de IA para el bucket de origen regional que contiene los conjuntos de datos de entrenamiento o los modelos que deseas entregar. Cuando tu trabajo de entrenamiento lee un archivo, este se extrae a la caché rápida dentro de la zona. Las lecturas posteriores se entregan directamente desde la caché, sin pasar por la red regional. Esto es ideal para los patrones de acceso a datos repetitivos en el entrenamiento de modelos y para la entrega de modelos de baja latencia.

Casos de uso recomendados:

  • Cargas de trabajo con mucha carga de lectura
  • Entrenamiento y entrega de modelos de baja latencia

Casos de uso no recomendados:

  • Aplicaciones que requieren cumplimiento total de POSIX

Prácticas recomendadas

Sigue estas prácticas recomendadas para el almacenamiento cuando uses zonas de IA:

  • Aprovisiona tu capa de rendimiento en la misma zona de IA que tus recursos de procesamiento. La ubicación conjunta del procesamiento y el almacenamiento ayuda a garantizar que las GPU y las TPU permanezcan completamente saturadas, lo que maximiza el "rendimiento útil" (rendimiento útil).

  • En el caso de Rapid Cache, antes de comenzar la época de entrenamiento principal, realiza una lectura previa de tu conjunto de datos para propagar o activar la caché respaldada por SSD.

Zonas de IA disponibles

En la siguiente tabla, se muestran las zonas de IA y sus regiones superiores Google Cloud.

Área geográfica Región superior Zona de IA
Estados Unidos us-central1 us-central1-ai1a
Estados Unidos us-south1 us-south1-ai1b

Consideraciones

  • Puedes acceder a los Google Cloud productos en una Google Cloud región desde la zona de IA de la región. Sin embargo, acceder a los servicios en una Google Cloud región desde una zona de IA puede agregar latencia de red, ya que la ubicación de la IA zona puede estar físicamente separada de las ubicaciones de las zonas estándar de la región.

  • Te recomendamos que ejecutes cargas de trabajo que no sean de AA en zonas estándar, no en zonas de IA, ya que las zonas de IA no ofrecen todos los Google Cloud servicios de forma local.

¿Qué sigue?