Cada servicio de Vertex AI requiere recursos de computación diferentes, incluidas las unidades de procesamiento gráfico (GPUs), tal como se describe en Planificación de la capacidad y requisitos de computación. En esta página se describe cómo aprovisionar recursos de GPU para ejecutar cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (ML) en un entorno de GPU. En esta página también se explica cómo habilitar las APIs preentrenadas de Vertex AI en el dispositivo aislado de Google Distributed Cloud (GDC) para que puedas empezar a implementar las funciones de Vertex AI.
La mayoría de las tareas para configurar recursos de GPU y habilitar o desactivar las APIs preentrenadas de Vertex AI requieren acceso de administrador. Si no tienes los permisos necesarios, pide a tu administrador que habilite las GPUs y las APIs preentrenadas de Vertex AI en tu nombre.
Vertex AI en el dispositivo aislado de GDC incluye tres APIs, una para cada uno de sus modelos preentrenados. Para obtener más información sobre estos modelos preentrenados, consulta la siguiente documentación:
- Reconocimiento óptico de caracteres (OCR): consulta información sobre las funciones de reconocimiento de caracteres.
- Speech-to-Text: consulta información sobre las funciones de reconocimiento de voz.
- Vertex AI Translation: consulta información sobre las funciones de traducción.
Usa la consola de GDC para habilitar, desactivar y ver los endpoints de las APIs preentrenadas de Vertex AI.
Antes de empezar
Para obtener los permisos que necesitas para habilitar las APIs preentrenadas, pide al administrador de gestión de identidades y accesos de tu organización o al administrador de gestión de identidades y accesos de tu proyecto que te conceda el rol Administrador de AI Platform (ai-platform-admin
) en el espacio de nombres del proyecto.
Para obtener información sobre este rol, consulta Preparar permisos de gestión de identidades y accesos. Para saber cómo conceder permisos a un sujeto, consulta Conceder y revocar el acceso.
Sigue estos pasos para aprovisionar las GPUs antes de habilitar las APIs preentrenadas:
- Configura un proyecto para usar Vertex AI.
- Asegúrate de que tu proyecto tenga configurada la comunicación de entrada adecuada.
- Gestionar cargas de trabajo de GPU.
- Inicia sesión en la consola de GDC. Si no puedes iniciar sesión, consulta Recuperar un dispositivo si el proveedor de identidad no está disponible.
Habilitar APIs preentrenadas
Puedes habilitar las APIs preentrenadas de OCR, Speech-to-Text y Vertex AI Translation mediante la consola de GDC.
Una vez que cumplas los requisitos, sigue estos pasos para habilitar las APIs preentrenadas:
- Inicia sesión en la consola de GDC.
- En el menú de navegación, haz clic en Vertex AI > APIs preentrenadas.
En la página APIs preentrenadas, haz clic en Habilitar en un servicio específico para habilitar esa API.
En el cuadro de diálogo de confirmación, haz clic en Habilitar. Se muestra un mensaje de progreso.
La duración de la habilitación varía. Puede tardar entre 15 y 45 minutos en completarse.
Si quieres ver el estado de las APIs preentrenadas, consulta el estado del servicio y los endpoints.
Desactivar APIs preentrenadas
Puedes desactivar las APIs preentrenadas OCR, Speech-to-Text y Vertex AI Translation mediante la consola de GDC.
Una vez que cumplas los requisitos previos, sigue estos pasos para desactivar las APIs preentrenadas:
- Inicia sesión en la consola de GDC.
- En el menú de navegación, haz clic en Vertex AI > APIs preentrenadas.
En la página APIs preentrenadas, haz clic en Inhabilitar en un servicio específico para desactivar esa API.
En el cuadro de diálogo de confirmación, introduce
disable
en el campo de texto para confirmar que quieres llevar a cabo esa acción. A continuación, haz clic en Inhabilitar. Se muestra un mensaje de progreso.
Si quieres ver el estado de las APIs preentrenadas, consulta el estado del servicio y los endpoints.