O Gemini Enterprise Agent Platform Vision (antigo Vertex AI Vision) é uma plataforma com tecnologia de IA para ingerir, analisar e armazenar dados de vídeo. Com a Agent Platform Vision, os usuários podem criar e implantar aplicativos com uma interface simplificada.
Com o Vision da plataforma de agentes, é possível criar soluções completas de imagens de computador aproveitando a integração do Vision da plataforma de agentes com outros componentes principais, como a análise de vídeo em tempo real, os fluxos de dados e o Warehouse do Vision. Com a API Gemini Enterprise Agent Platform Vision, é possível criar um app de alto nível com APIs de baixo nível, além de criar e atualizar um fluxo de trabalho de alto nível que combina várias chamadas de API individuais. Em seguida, execute o fluxo de trabalho como uma unidade fazendo uma única solicitação de implantação para o servidor da plataforma Agent Platform Vision.
Com a Visão da plataforma de agentes, você pode:
- Ingerir dados de vídeo em tempo real
- Analisar dados para insights usando modelos de IA de visão gerais e personalizados
- Armazene insights no Warehouse do Vision para simplificar consultas e informações de metadados.
Fluxo de trabalho do Vision na plataforma do agente
As etapas para usar a plataforma Agent Vision são as seguintes:
Ingerir dados em tempo real
A arquitetura da Agent Platform Vision permite transmitir de forma rápida e conveniente a infraestrutura de ingestão de vídeo em tempo real em uma nuvem pública.
Analise dados
Depois que os dados são ingeridos, o framework da Agent Platform Vision oferece acesso direto e orquestração de um portfólio grande e crescente de modelos de análise gerais, personalizados e especializados.
Armazenar e consultar saída
Depois que o app analisa seus dados, você pode enviar essas informações para um destino de armazenamento (Warehouse do Vision ou BigQuery) ou receber os dados em tempo real. Com o Warehouse do Vision, é possível enviar a saída do app para um data warehouse que generaliza seu trabalho de pesquisa e atende a vários tipos de dados e casos de uso.
Observação sobre a IA responsável
No Google Cloud, priorizamos ajudar os clientes a desenvolver e implementar soluções com segurança usando a plataforma de agentes do Gemini Enterprise Vision. Para a plataforma de agentes do Gemini Enterprise Vision, trabalhamos para desenvolver uma performance justa e equitativa de acordo com os princípios de IA do Google.
Esse trabalho inclui testes de viés durante o desenvolvimento, por exemplo, analisando o desempenho em diferentes tons de pele e desenvolvendo recursos de produtos para melhorar a privacidade e limitar a identificação pessoal, como o desfoque de pessoas e rostos. Nosso compromisso é iterar e melhorar, e vamos continuar incorporando práticas recomendadas e lições aprendidas aos nossos produtos da Vertex AI.
Quando a plataforma de agentes do Gemini Enterprise Vision é integrada ao contexto organizacional exclusivo de um cliente, provavelmente há outras considerações de IA responsável. Incentivamos os clientes a aproveitar as práticas recomendadas de imparcialidade, interpretabilidade, privacidade e segurança ao implementar o Gemini Enterprise Agent Platform Vision, principalmente ao criar modelos personalizados ou treinados com o AutoML. Ao longo desta documentação técnica, oferecemos mais orientações e recursos para apoiar esse trabalho. Para saber mais, leia as recomendações do Google sobre práticas de IA responsável.
A seguir
- Leia mais na postagem do blog "Vertex AI Vision: crie e implante aplicativos de visão computacional com facilidade e em grande escala".
- Saiba mais sobre modelos específicos no guia de análise de ocupação, guia de desfoque de pessoas, guia de detector de pessoas/veículos ou guia de filtragem de movimento.
- Teste a Plataforma de Agentes Vision no Google Cloud console lendo o guia de início rápido Criar um app no console.
- Configure seu ambiente local para usar o Agent Platform Vision.