A Vertex AI no Google Distributed Cloud (GDC) com lacuna de ar inclui uma lista crescente de modelos de IA generativa de base que pode testar, implementar e implementar para as suas aplicações com lacuna de ar. Os modelos de base são otimizados para exemplos de utilização específicos e oferecidos a preços diferentes. Esta página resume as famílias de modelos disponíveis nas APIs de IA generativa na GDC e dá-lhe orientações sobre os modelos a escolher por exemplo de utilização.
Modelos de incorporações
As incorporações convertem dados textuais escritos numa linguagem natural em vetores numéricos. Estas representações vetoriais foram concebidas para captar o significado semântico e o contexto das palavras que representam. Os modelos de incorporação de texto podem gerar incorporações otimizadas para vários tipos de tarefas, como obtenção de documentos, perguntas e respostas, classificação e verificação de factos. Para texto em inglês, use text-embedding-004
. Para texto multilingue, use
text-multilingual-embedding-002
.
A tabela seguinte resume os modelos disponíveis na API Embeddings. Para mais informações sobre incorporações, consulte o artigo Incorporações de texto.
Modelo | Descrição | Especificações |
---|---|---|
Incorporação de texto ( text-embedding-004 ) |
Devolve incorporações para entradas de texto em inglês. | Entrada máxima de tokens: 2048. Dimensões de incorporação: inferior a 768. |
Text Embedding Multilingual ( text-multilingual-embedding-002 ) |
Devolve incorporações para entradas de texto de mais de 100 idiomas. | Entrada máxima de tokens: 2048. Dimensões de incorporação: inferior a 768. |