Versioni e ciclo di vita del modello di generazione di risposte

Vertex AI Search offre più versioni del modello tra cui scegliere quando generi risposte. Puoi scegliere le versioni del modello quando utilizzi i riepiloghi della ricerca e le risposte e i follow-up.

Modelli disponibili

Vertex AI Search utilizza due tipi di modelli per i casi d'uso di domande e risposte:

  • Modelli LLM Vertex AI testati su attività di domande e risposte
  • Modelli Vertex AI Search basati su modelli LLM Vertex AI e ulteriormente addestrati per rispondere a domande e risposte

I modelli di Vertex AI Search condividono la stessa data di ritiro dei modelli LLM di base di Vertex AI. Il modello LLM di base è disponibile per sei mesi dopo la data di rilascio della versione successiva del modello, in base alle norme sul ciclo di vita dei modelli Vertex AI. Lascia tempo sufficiente per eseguire la migrazione ai nuovi modelli prima delle date di ritiro.

La tabella seguente elenca le specifiche della versione del modello. Quando imposti una specifica del modello, l'API utilizza il modello specificato per generare le risposte.

Verticale di settore Personalizzato Sanità
Versione del modello Descrizione Finestra contestuale Data di interruzione Descrizione Finestra contestuale Data di interruzione
stable

La scelta del modello predefinito se la versione del modello non è impostata.

La specifica del modello stable rimanda a gemini-2.5-flash/answer_gen/v1.

Il modello designato come stable cambia periodicamente man mano che diventano disponibili nuovi modelli e versioni.

128.000 N/D

La scelta del modello predefinito se la versione del modello non è impostata.

La specifica del modello stable rimanda a gemini-2.5-flash/answer_gen/v1.

Il modello designato come stable cambia periodicamente man mano che diventano disponibili nuovi modelli e versioni.

128.000 N/D
gemini-2.5-flash/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-2.5-flash con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 17 giugno 2026

Un modello Vertex AI Search basato sul modello gemini-2.5-flash con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 17 giugno 2026
gemini-2.0-flash-001/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-2.0-flash-001 con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 5 febbraio 2026

Un modello Vertex AI Search basato sul modello gemini-2.0-flash-001 con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 5 febbraio 2026
gemini-1.5-flash-002/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-002 con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 24 settembre 2025 Non disponibile
gemini-1.5-flash-001/answer_gen/v2

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva (versione 2) su dati strutturati e non strutturati combinati per rispondere a domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 24 maggio 2025

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva (versione 2) su dati strutturati e non strutturati combinati per rispondere a domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 24 maggio 2025
gemini-1.5-flash-001/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 24 maggio 2025

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva per gestire le attività di domande e risposte.

Il modello viene bloccato dopo il rilascio.

128.000 24 maggio 2025
preview

La specifica del modello di anteprima punta all'ultimo modello gemini-1.5-pro-002. Il modello di anteprima è soggetto a modifiche senza preavviso. Se utilizzi preview come modello, potresti notare modifiche nelle risposte quando il modello cambia. Se vuoi coerenza nelle risposte, seleziona un modello specifico.

128.000 N/D

La specifica del modello di anteprima punta all'ultimo modello gemini-1.5-pro-002. Il modello di anteprima è soggetto a modifiche senza preavviso. Se utilizzi preview come modello, potresti notare modifiche nelle risposte quando il modello cambia. Se vuoi coerenza nelle risposte, seleziona un modello specifico.

128.000 N/D

Passaggi successivi