Gemini 3.1 Flash-Lite è il nostro modello Gemini più conveniente, ottimizzato per i casi d'uso a bassa latenza per il traffico LLM ad alto volume e sensibile ai costi. Offre un aumento significativo della qualità rispetto ai modelli Gemini 2.0 Flash-Lite e Flash-Lite, eguagliando le prestazioni di Gemini 2.5 Flash nelle aree di funzionalità chiave:
- Migliore qualità delle risposte:mira a eguagliare le prestazioni di 2.5 Flash e ad allinearsi ai casi d'uso di Flash-Lite di destinazione.
- Migliore esecuzione delle istruzioni: miglioramenti mirati per fungere da percorso di migrazione affidabile per chatbot complessi e flussi di lavoro con molte istruzioni.
- Miglioramento dell'input audio: miglioramento della qualità dell'input audio per attività come il riconoscimento vocale automatico (ASR).
- Supporto per il pensiero espanso:puoi controllare la quantità di ragionamento eseguita dal modello scegliendo tra i livelli di pensiero minimo, basso, medio o alto. Questa funzionalità ti consente di bilanciare la qualità e la velocità della risposta per il tuo caso d'uso specifico.
Prova in Vertex AI (anteprima) Esegui il deployment dell'app di esempio
| ID modello | gemini-3.1-flash-lite-preview |
|
|---|---|---|
| Input e output supportati |
|
|
| Limiti di token |
|
|
| Funzionalità |
|
|
| Opzioni di consumo |
|
|
| Per saperne di più, consulta Opzioni di consumo. | ||
| Specifiche tecniche | ||
| Immagini |
|
|
| Documenti |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, consulta Deployment ed endpoint. | ||
| Data del knowledge cutoff | Gennaio 2025 | |
| Versioni |
|
|
| Lingue supportate | Consulta la sezione Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |