Descripción general de AI Hypercomputer

AI Hypercomputer es un sistema de supercomputación optimizado para admitir cargas de trabajo de Inteligencia Artificial (IA) y aprendizaje automático (AA). Es un sistema integrado de hardware con rendimiento optimizado, software abierto, frameworks de AA y modelos de consumo flexibles.

El sistema AI Hypercomputer incorpora prácticas recomendadas y diseño a nivel del sistema para aumentar la eficiencia y la productividad en el preentrenamiento, el ajuste y la entrega de la IA.

Arquitectura del sistema

AI Hypercomputer consta de las siguientes capas:

Infraestructura optimizada para el rendimiento: Contiene aceleradores, redes y recursos de almacenamiento que proporcionan las capacidades de procesamiento para admitir tus cargas de trabajo.
Software abierto: Versiones optimizadas de frameworks populares de aprendizaje automático, como TensorFlow, PyTorch y JAX. Google proporciona sistemas operativos (SO) configurados con software esencial para aprovechar los recursos de procesamiento aprovisionados en tus clústeres. Para implementar y administrar una gran cantidad de aceleradores como una sola unidad, puedes usar Cluster Director, Google Kubernetes Engine o Slurm. Como alternativa, puedes implementar tus recursos de forma manual con las APIs de Compute Engine.
Opciones de consumo: Varias opciones para aprovisionar clústeres que optimizan los costos y la disponibilidad de hardware según tus necesidades específicas y patrones de carga de trabajo.

Beneficios

AI Hypercomputer tiene los siguientes beneficios:

Alto rendimiento y procesamiento útil: Las métricas de Goodput miden la productividad del AA. AI Hypercomputer optimiza las capas de programación, tiempo de ejecución y organización.
Puesta en marcha rápida: AI Hypercomputer proporciona herramientas, como Cluster Director y plantillas, que te permiten implementar de forma confiable y repetida grandes cantidades de recursos optimizados para aceleradores que están configurados para admitir tus cargas de trabajo de IA y AA más exigentes.

Casos de uso

AI Hypercomputer se diseñó para satisfacer las necesidades de los siguientes casos de uso:

Caso de uso	Ejemplos de cargas de trabajo
Cargas de trabajo de IA y AA a gran escala	Entrenamiento distribuido de IA generativa Inferencia de IA generativa Detección de fraudes Modelos de recomendación
Computación de alto rendimiento (HPC)	Simulaciones complejas Descubrimiento de fármacos, plegamiento de proteínas y análisis genómico Análisis de riesgos y operaciones comerciales cuantitativas

Caso de uso

Ejemplos de cargas de trabajo

Cargas de trabajo de IA y AA a gran escala

Entrenamiento distribuido de IA generativa

Inferencia de IA generativa

Detección de fraudes

Modelos de recomendación

Computación de alto rendimiento (HPC)

Simulaciones complejas

Descubrimiento de fármacos, plegamiento de proteínas y análisis genómico

Análisis de riesgos y operaciones comerciales cuantitativas

Próximos pasos

Revisa la infraestructura optimizada para el rendimiento.
Revisa la descripción general de las redes de GPU.
Revisa los modelos de consumo.
Obtén más información sobre la administración de clústeres.

Descripción general de AI Hypercomputer Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.