A Vertex AI é uma plataforma unificada e aberta para criar, implantar e escalonar modelos de IA generativa e machine learning (ML) e aplicativos de IA. Ele fornece acesso ao Model Garden, que tem um catálogo selecionado de mais de 200 modelos, incluindo modelos de fundação do Google (como o Gemini) e uma seleção abrangente de modelos de parceiros e abertos, além da infraestrutura de TPU/GPU. A Vertex AI oferece suporte a fluxos de trabalho de GenAI de ponta e de inferência de IA para MLOps. Ela oferece ferramentas de MLOps de ponta a ponta e controles de nível empresarial para governança, segurança e compliance.
Principais recursos da Vertex AI
A Vertex AI inclui ferramentas e serviços que oferecem suporte à IA generativa, bem como fluxos de trabalho de inferência de IA e machine learning.
Recursos de IA generativa
A Vertex AI reúne um conjunto de ferramentas abrangente com as ferramentas avançadas de modelos de fundação do Google que você pode usar para criar agentes e aplicativos de IA generativa prontos para produção, da seguinte forma:
Comandos: comece com a criação de comandos no Vertex AI Studio. O Vertex AI Studio inclui ferramentas para design de comandos e gerenciamento de modelos que podem ser usadas para criar protótipos, desenvolver e implantar aplicativos de IA generativa.
Modelos: o Model Garden da Vertex AI é um hub centralizado com mais de 200 modelos prontos para empresas do Google, dos principais parceiros terceirizados (como o Claude da Anthropic) e opções de código aberto populares (como o Llama).
Essa seleção de modelos inclui o seguinte:
Modelos básicos de IA generativa do Google:
- Gemini: recursos multimodais para texto, imagens, vídeo e áudio, além de recursos de raciocínio para modelos, como o Gemini 3 Flash e o Gemini 3 Pro (com o Nano Banana).
- Imagen na Vertex AI: gere e edite imagens.
- Veo na Vertex AI: gere vídeos com base em texto e imagens.
Modelos de parceiros e de código aberto: acesse uma seleção de modelos líderes, como Claude da Anthropic, modelos da Mistral AI e Llama, com excelente custo-benefício. Esses modelos estão disponíveis como APIs modelo como serviço (MaaS) totalmente gerenciadas.
Personalização de modelos: adapte os modelos à sua empresa para criar recursos exclusivos de IA. Isso varia desde o embasamento com seus dados corporativos ou a Pesquisa Google para reduzir alucinações até o uso do treinamento da Vertex AI para ajuste supervisionado (SFT) ou ajuste eficiente de parâmetros (PEFT) de modelos como o Gemini. Para mais informações sobre a personalização de modelos, consulte Introdução ao ajuste.
Avaliações de IA generativa: avalie e compare de forma objetiva o desempenho de modelos e agentes com os recursos de avaliação de IA generativa da Vertex AI. Garanta a segurança e a conformidade implantando recursos de defesa de execução, como o Model Armor, para inspecionar e proteger de forma proativa contra ameaças emergentes, como injeção de comandos e exfiltração de dados.
Criadores de agentes: o Vertex AI Agent Builder é um sistema de transformação de agentes full-stack que ajuda você a criar, gerenciar e implantar agentes de IA. Use o Kit de Desenvolvimento de Agente (ADK) de código aberto para criar e orquestrar agentes e depois implante-os no Vertex AI Agent Engine gerenciado e sem servidor para uso em reduzir escalonamento horizontal produção. Cada agente recebe uma identidade de agente (principal do Identity and Access Management) para segurança e uma trilha de auditoria clara.
Acessar informações externas: melhore as respostas do modelo conectando-se a fontes confiáveis com embasamento, interagindo com APIs externas usando chamada de função e recuperando informações de bases de conhecimento com RAG.
IA responsável e segurança: use os recursos de segurança integrados para bloquear conteúdo nocivo e garantir o uso responsável da IA.
Para mais informações sobre a IA generativa na Vertex AI, consulte a documentação da IA generativa na Vertex AI.
Recursos de inferência de IA
A Vertex AI oferece ferramentas e serviços que correspondem a cada etapa do fluxo de trabalho de ML:
Preparação de dados: colete, limpe e transforme seus dados.
- Use os notebooks do Vertex AI Workbench para realizar análise exploratória de dados (EDA).
- Integrar ao Cloud Storage e ao BigQuery para acesso a dados.
- Use o Dataproc sem servidor para Spark para processamento de dados em grande escala.
Treinamento do modelo: treine seu modelo de ML.
- Escolha entre AutoML para treinamento sem código ou Treinamento personalizado para controle total.
- Gerencie e compare execuções de treinamento usando os Experimentos da Vertex AI.
- Registre modelos treinados no Vertex AI Model Registry.
- O Vertex AI Training
oferece treinamento sem servidor e clusters de treinamento.
- Use o treinamento sem servidor da Vertex AI para executar seu código de treinamento personalizado sob demanda em um ambiente totalmente gerenciado. Consulte a [visão geral do treinamento sem servidor da Vertex AI][serverless].
- Use clusters de treinamento da Vertex AI para jobs grandes que precisam de capacidade garantida em clusters de aceleradores dedicados e reservados. Confira a visão geral dos clusters de treinamento da Vertex AI.
- Use o Ray na Vertex AI para escalonar cargas de trabalho de Python e ML com o framework de código aberto Ray em um cluster gerenciado e interativo. Confira a visão geral do Ray na Vertex AI.
- Use o Vertex AI Vizier para ajustar hiperparâmetros de modelos em modelos complexos de ML.
Avaliação e iteração de modelos: avalie e melhore a performance do modelo.
- Use métricas de avaliação de modelos para comparar modelos.
- Integre avaliações nos fluxos de trabalho do Vertex AI Pipelines.
Exibição do modelo: implante e receba inferências do modelo.
- Implante para inferências on-line com contêineres pré-criados ou personalizados.
- Realizar inferências em lote para grandes conjuntos de dados.
- Use o ambiente de execução otimizado do TensorFlow para uma veiculação eficiente do TensorFlow.
- Entenda as inferências do modelo com a Vertex Explainable AI.
- Disponibilize recursos da Vertex AI Feature Store.
- Implante modelos treinados com o BigQuery ML.
Monitoramento de modelos: acompanhe o desempenho do modelo implantado ao longo do tempo.
- Use o Vertex AI Model Monitoring para detectar desvios de treinamento/serviço e deslocamentos de inferência.
Ferramentas de MLOps
Automatize, gerencie e monitore seus projetos de ML:
- Vertex AI Pipelines:orquestre e automatize fluxos de trabalho de ML como pipelines reutilizáveis.
- Vertex AI Model Registry:gerencie o ciclo de vida dos seus modelos de ML, incluindo controle de versões e implantação.
- Treinamento sem servidor da Vertex AI: execute seu código de treinamento personalizado sob demanda em um ambiente totalmente gerenciado.
- Vertex AI Model Monitoring:monitore modelos implantados em relação a desvios e deslocamentos de dados para manter o desempenho.
- Experimentos da Vertex AI:acompanhe e analise diferentes arquiteturas de modelos e hiperparâmetros.
- Feature Store da Vertex AI: gerencie e forneça dados de atributos para treinar modelos ou fazer previsões em tempo real.
- Vertex ML Metadata:rastreie e gerencie metadados de artefatos de ML.
- Clusters de treinamento da Vertex AI: treine jobs em grande escala que exigem capacidade garantida em um cluster dedicado e reservado de aceleradores.
- Ray na Vertex AI: escale cargas de trabalho de Python e ML usando o framework Ray de código aberto em um cluster gerenciado e interativo.
A seguir
- Saiba mais sobre a IA generativa na Vertex AI.
- Saiba mais sobre os recursos de MLOps da Vertex AI.
- Conheça as interfaces que podem ser usadas para interagir com a Vertex AI.