Versões e ciclo de vida do modelo de geração de respostas

A Vertex AI para Pesquisa oferece várias versões de modelo para você escolher ao gerar respostas. É possível escolher as versões de modelo ao usar resumos de pesquisa e respostas e acompanhamentos.

Modelos disponíveis

A Vertex AI para Pesquisa usa dois tipos de modelos para casos de uso de perguntas e respostas:

  • Modelos LLM da Vertex AI que foram testados em tarefas de perguntas e respostas
  • Modelos da Vertex AI para Pesquisa que são baseados em modelos LLM da Vertex AI e treinados para resolver tarefas de perguntas e respostas

Os modelos da Vertex AI para Pesquisa compartilham a mesma data de desativação dos modelos LLM da Vertex AI. O modelo LLM de base fica disponível por seis meses após a data de lançamento da próxima versão do modelo, de acordo com a política de ciclo de vida do modelo da Vertex AI. Deixe tempo suficiente para migrar para novos modelos antes das datas de desativação.

A tabela a seguir lista as especificações da versão do modelo. Ao definir uma especificação de modelo, a API usa o modelo especificado para gerar respostas.

Segmento do setor Personalizado Saúde
Versão do modelo Descrição Janela de contexto Data de desativação Descrição Janela de contexto Data de desativação
stable

A escolha de modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-2.5-flash/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A

A escolha de modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-2.5-flash/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A
gemini-2.5-flash/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no gemini-2.5-flash modelo com ajuste adicional para resolver tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 17 de junho de 2026

Um modelo da Vertex AI para Pesquisa baseado no gemini-2.5-flash modelo com ajuste adicional para resolver tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 17 de junho de 2026
gemini-2.0-flash-001/answer_gen/v1

Um modelo da Vertex AI para Pesquisa baseado no gemini-2.0-flash-001 modelo com ajuste adicional para resolver tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 5 de fevereiro de 2026

Um modelo da Vertex AI para Pesquisa baseado no gemini-2.0-flash-001 modelo com ajuste adicional para resolver tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 5 de fevereiro de 2026
preview

A especificação do modelo de visualização aponta para o gemini-2.5-flash modelo. O modelo de visualização está sujeito a mudanças sem notificação. Se você usar preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se quiser consistência nas respostas, selecione um modelo específico.

128 mil N/A

A especificação do modelo de visualização aponta para o gemini-2.5-flash modelo. O modelo de visualização está sujeito a mudanças sem notificação. Se você usar preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se quiser consistência nas respostas, selecione um modelo específico.

128 mil N/A