Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite è il nostro modello Gemini più conveniente, ottimizzato per i casi d'uso a bassa latenza per il traffico LLM ad alto volume e sensibile ai costi. Offre un aumento significativo della qualità rispetto ai modelli Gemini 2.0 Flash-Lite e Flash-Lite, eguagliando le prestazioni di Gemini 2.5 Flash nelle aree di funzionalità chiave:

Migliore qualità delle risposte:mira a eguagliare le prestazioni di 2.5 Flash e ad allinearsi ai casi d'uso di Flash-Lite di destinazione.
Migliore esecuzione delle istruzioni: miglioramenti mirati per fungere da percorso di migrazione affidabile per chatbot complessi e flussi di lavoro con molte istruzioni.
Miglioramento dell'input audio: miglioramento della qualità dell'input audio per attività come il riconoscimento vocale automatico (ASR).
Supporto per il pensiero espanso:puoi controllare la quantità di ragionamento eseguita dal modello scegliendo tra i livelli di pensiero minimo, basso, medio o alto. Questa funzionalità ti consente di bilanciare la qualità e la velocità della risposta per il tuo caso d'uso specifico.

Prova in Vertex AI (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.

Specifiche tecniche
ID modello	`gemini-3.1-flash-lite-preview`
Input e output supportati	Input: Testo, Codice, Immagini, Audio, Video, PDF Output: Testo
Limiti di token	Numero massimo di token di input: 1.048.576 Numero massimo di token di output: 65.535 (valore predefinito)
Funzionalità	Supportato Grounding con la Ricerca Google Esecuzione del codice Istruzioni di sistema Chiamata di funzione Conteggio token Output strutturato Pensieroso Memorizzazione nella cache implicita del contesto Memorizzazione nella cache del contesto esplicito Vertex AI RAG Engine Completamenti della chat Non supportata API Gemini Live Content Credentials (C2PA)
Opzioni di consumo	Supportato Throughput riservato Standard PayGo Flex PayGo Priority PayGo Previsione batch Non supportata
Opzioni di consumo	Per saperne di più, consulta Opzioni di consumo.
	Immagini	Numero massimo di immagini per prompt: 3000 Dimensioni massime del file per i dati in linea o i caricamenti diretti tramite la console: 7 MB Dimensione massima del file per file da Google Cloud Storage: 30 MB Numero massimo di immagini di output per prompt: 10 Tipi MIME supportati: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documenti	Numero massimo di file per prompt: 3000 Numero massimo di pagine per file: 1000 Dimensione massima del file per file: 50 MB Tipi MIME supportati: `application/pdf`, `text/plain`
	Video	Durata massima del video (con audio): Circa 45 minuti Durata massima del video (senza audio): Circa 1 ora Numero massimo di video per prompt: 10 Tipi MIME supportati: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token Numero massimo di file audio per prompt: 1 Tipi MIME supportati: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valori predefiniti dei parametri	Temperatura: 0.0-2.0 (valore predefinito 1.0) topP: 0,0-1,0 (valore predefinito 0,95) topK: 64 (fisso) candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate
	Disponibilità del modello	Globale globale
	Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff	Gennaio 2025
Versioni	`gemini-3.1-flash-lite-preview` Fase di lancio: anteprima pubblica Data di rilascio: 3 marzo 2026
Lingue supportate	Consulta la sezione Lingue supportate.
Prezzi	Vedi Prezzi.

Gemini 3.1 Flash-Lite Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Gemini 3.1 Flash-Lite