Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite è il nostro modello Gemini più conveniente, ottimizzato per i casi d'uso a bassa latenza per il traffico LLM ad alto volume e sensibile ai costi. Offre un aumento significativo della qualità rispetto ai modelli Gemini 2.0 Flash-Lite e Flash-Lite, eguagliando le prestazioni di Gemini 2.5 Flash nelle aree di funzionalità chiave:

  • Migliore qualità delle risposte:mira a eguagliare le prestazioni di 2.5 Flash e ad allinearsi ai casi d'uso di Flash-Lite di destinazione.
  • Migliore esecuzione delle istruzioni: miglioramenti mirati per fungere da percorso di migrazione affidabile per chatbot complessi e flussi di lavoro con molte istruzioni.
  • Miglioramento dell'input audio: miglioramento della qualità dell'input audio per attività come il riconoscimento vocale automatico (ASR).
  • Supporto per il pensiero espanso:puoi controllare la quantità di ragionamento eseguita dal modello scegliendo tra i livelli di pensiero minimo, basso, medio o alto. Questa funzionalità ti consente di bilanciare la qualità e la velocità della risposta per il tuo caso d'uso specifico.

Prova in Vertex AI (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.
ID modello gemini-3.1-flash-lite-preview
Input e output supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video, PDF
  • Output:
    Testo
Limiti di token
  • Numero massimo di token di input: 1.048.576
  • Numero massimo di token di output: 65.535 (valore predefinito)
Funzionalità
Opzioni di consumo
Per saperne di più, consulta Opzioni di consumo.
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 3000
  • Dimensioni massime del file per i dati in linea o i caricamenti diretti tramite la console: 7 MB
  • Dimensione massima del file per file da Google Cloud Storage: 30 MB
  • Numero massimo di immagini di output per prompt: 10
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documenti
  • Numero massimo di file per prompt: 3000
  • Numero massimo di pagine per file: 1000
  • Dimensione massima del file per file: 50 MB
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0,0-1,0 (valore predefinito 0,95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

  • Globale
    • globale
Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-3.1-flash-lite-preview
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 3 marzo 2026
Lingue supportate Consulta la sezione Lingue supportate.
Prezzi Vedi Prezzi.