Gemini 3 Pro

Gemini 3 Pro è il nostro modello Gemini di ragionamento più avanzato, in grado di risolvere problemi complessi. Gemini 3 Pro può comprendere vasti set di dati e problemi complessi provenienti da diverse fonti di informazione, tra cui testo, audio, immagini, video, PDF e persino interi repository di codice con la sua finestra contestuale da 1 milione di token.

Gemini 3 Pro introduce diverse nuove funzionalità per migliorare le prestazioni, il controllo e la fedeltà multimodale:

  • Livello di ragionamento: utilizza il parametro thinking_level per controllare la quantità di ragionamento interno eseguito dal modello (basso o alto) per bilanciare qualità della risposta, complessità del ragionamento, latenza e costo. Il parametro thinking_level sostituisce thinking_budget per i modelli Gemini 3.
  • Risoluzione dei contenuti multimediali: utilizza il parametro media_resolution (low, medium o high) per controllare l'elaborazione della visione per gli input multimodali, influendo sull'utilizzo dei token e sulla latenza. Consulta Inizia a utilizzare Gemini 3 per le impostazioni di risoluzione predefinite.
  • Firme del pensiero: la convalida più rigorosa delle firme del pensiero migliora l'affidabilità delle chiamate di funzioni multi-turno.
  • Risposte multimodali delle funzioni: le risposte delle funzioni ora possono includere oggetti multimodali come immagini e PDF, oltre al testo.
  • Chiamata di funzioni in streaming: trasmetti in streaming gli argomenti parziali della chiamata di funzioni per migliorare l'esperienza utente durante l'utilizzo degli strumenti.

Per ulteriori informazioni sull'utilizzo di queste funzionalità, vedi Inizia a utilizzare Gemini 3 Pro.

Prova in Vertex AI Visualizza in Model Garden (Anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.
ID modello gemini-3-pro-preview
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video, PDF
  • Output:
    Testo
Limiti di token
  • Token di input massimi: 1.048.576
  • Numero massimo di token di output: 65.536
Funzionalità
Tipi di utilizzo
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 900
  • Dimensioni massime per file per i dati in linea o i caricamenti diretti tramite la console: 7 MB
  • Dimensione massima del file per file da Google Cloud Storage: 30 MB
  • Token di risoluzione predefiniti: 1120
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documenti
  • Numero massimo di file per prompt: 900
  • Numero massimo di pagine per file: 900
  • Dimensione massima del file per importazioni API o Cloud Storage: 50 MB
  • Dimensioni massime del file per i caricamenti diretti tramite la console: 7 MB
  • Token di risoluzione predefiniti: 560
  • OCR per i PDF scansionati: Non utilizzato per impostazione predefinita
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token di risoluzione predefiniti per fotogramma: 70
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

(Include la quota condivisa dinamica e il throughput riservato)

  • Globale
    • globale
Per saperne di più, consulta Residenza dei dati.
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-3-pro-preview
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 18 novembre 2025
Controlli di sicurezza
Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate Consulta la sezione Lingue supportate.
Prezzi Vedi Prezzi.