Modelos de IA generativa disponíveis

A Vertex AI no Google Distributed Cloud (GDC) com lacuna de ar inclui uma lista crescente de modelos de IA generativa de base que pode testar, implementar e implementar para as suas aplicações com lacuna de ar. Os modelos de base são otimizados para exemplos de utilização específicos e oferecidos a preços diferentes. Esta página resume as famílias de modelos disponíveis nas APIs de IA generativa na GDC e dá-lhe orientações sobre os modelos a escolher por exemplo de utilização.

Modelos de incorporações

As incorporações convertem dados textuais escritos numa linguagem natural em vetores numéricos. Estas representações vetoriais foram concebidas para captar o significado semântico e o contexto das palavras que representam. Os modelos de incorporação de texto podem gerar incorporações otimizadas para vários tipos de tarefas, como obtenção de documentos, perguntas e respostas, classificação e verificação de factos. Para texto em inglês, use text-embedding-004. Para texto multilingue, use text-multilingual-embedding-002.

A tabela seguinte resume os modelos disponíveis na API Embeddings. Para mais informações sobre incorporações, consulte o artigo Incorporações de texto.

Modelo Descrição Especificações
Incorporação de texto

(text-embedding-004)
Devolve incorporações para entradas de texto em inglês. Entrada máxima de tokens: 2048.

Dimensões de incorporação: inferior a 768.
Text Embedding Multilingual

(text-multilingual-embedding-002)
Devolve incorporações para entradas de texto de mais de 100 idiomas. Entrada máxima de tokens: 2048.

Dimensões de incorporação: inferior a 768.