Gemini 3 Pro

Gemini 3 Pro è il nostro modello Gemini di ragionamento più avanzato, in grado di risolvere problemi complessi. Gemini 3 Pro può comprendere vasti set di dati e problemi complessi provenienti da diverse fonti di informazione, tra cui testo, audio, immagini, video, PDF e persino interi repository di codice con la sua finestra contestuale da 1 milione di token.

Modifiche alla qualità

Quando esegui la migrazione da Gemini 2.5 Pro a Gemini 3 Pro, puoi aspettarti miglioramenti significativi nel ragionamento di alto livello, nell'esecuzione di istruzioni complesse, nell'utilizzo degli strumenti, nei casi d'uso degli agenti e in una migliore gestione del contesto lungo (inclusa la comprensione di immagini e documenti). I modelli Gemini 3 Pro non sono progettati per dare la priorità al supporto della comprensione dell'audio o ai casi d'uso della segmentazione delle immagini. Per un output ad alte prestazioni in questi casi d'uso, prova a utilizzare modelli creati appositamente tenendo conto di queste esigenze. Per grafici, tabelle o diagrammi densi di informazioni o complicati, il modello può a volte estrarre informazioni in modo errato o interpretare male le risorse fornite. Presentare le informazioni chiave nel modo più semplice possibile può contribuire a garantire l'output preferito quando lavori con Gemini 3 Pro.

Modifiche al funzionamento

Gemini 3 Pro è progettato per un'elevata efficienza e azione. Il modello è stato addestrato per fornire risposte concise e dirette e per tentare di risolvere l'intento dell'utente il più rapidamente possibile. Poiché il modello è progettato per dare la priorità all'utilità, a volte potrebbe fare delle ipotesi quando mancano informazioni o dare la priorità a una risposta soddisfacente rispetto a istruzioni rigorose. Questo comportamento può essere mitigato o modificato con i prompt. Per ulteriori informazioni e best practice, vedi Inizia a utilizzare Gemini 3.

Nuove funzionalità

Gemini 3 Pro introduce diverse nuove funzionalità per migliorare le prestazioni, il controllo e la fedeltà multimodale:

  • Livello di ragionamento: utilizza il parametro thinking_level per controllare la quantità di ragionamento interno eseguito dal modello (basso o alto) per bilanciare qualità della risposta, complessità del ragionamento, latenza e costo. Il parametro thinking_level sostituisce thinking_budget per i modelli Gemini 3.
  • Risoluzione dei contenuti multimediali: utilizza il parametro media_resolution (low, medium o high) per controllare l'elaborazione della visione per gli input multimodali, influendo sull'utilizzo dei token e sulla latenza. Consulta Inizia a utilizzare Gemini 3 per le impostazioni di risoluzione predefinite.
  • Firme del pensiero: la convalida più rigorosa delle firme del pensiero migliora l'affidabilità delle chiamate di funzioni multi-turno.
  • Risposte delle funzioni multimodali: le risposte delle funzioni ora possono includere oggetti multimodali come immagini e PDF, oltre al testo.
  • Chiamata di funzioni in streaming: trasmetti in streaming gli argomenti parziali della chiamata di funzione per migliorare l'esperienza utente durante l'utilizzo dello strumento.

Per ulteriori informazioni sull'utilizzo di queste funzionalità, vedi Inizia a usare Gemini 3.

Prova in Vertex AI Visualizza in Model Garden (Anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.
ID modello gemini-3-pro-preview
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video, PDF
  • Output:
    Testo
Limiti di token
  • Token di input massimi: 1.048.576
  • Numero massimo di token di output: 65.536
Funzionalità
Tipi di utilizzo
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 900
  • Dimensioni massime del file per i dati in linea o i caricamenti diretti tramite la console: 7 MB
  • Dimensione massima del file per file da Google Cloud Storage: 30 MB
  • Token di risoluzione predefiniti: 1120
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documenti
  • Numero massimo di file per prompt: 900
  • Numero massimo di pagine per file: 900
  • Dimensione massima del file per importazioni API o Cloud Storage: 50 MB
  • Dimensioni massime del file per i caricamenti diretti tramite la console: 7 MB
  • Token di risoluzione predefiniti: 560
  • OCR per i PDF scansionati: Non utilizzato per impostazione predefinita
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token di risoluzione predefiniti per fotogramma: 70
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

(include Standard PayGo e Throughput riservato)

  • Globale
    • globale
Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-3-pro-preview
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 18 novembre 2025
Controlli di sicurezza
Previsione online
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Previsione batch
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Ottimizzazione
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Memorizzazione nella cache contestuale
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Per saperne di più, consulta Controlli di sicurezza.
Lingue supportate Consulta la sezione Lingue supportate.
Prezzi Vedi Prezzi.