Gemini 3 Pro è il nostro modello Gemini di ragionamento più avanzato, in grado di risolvere problemi complessi. Grazie alla finestra contestuale di 1 milione di token, Gemini 3 Pro può comprendere vasti set di dati e problemi complessi provenienti da diverse fonti di informazione, tra cui testo, audio, immagini, video, PDF e persino interi repository di codice.
Modifiche alla qualità
Quando esegui la migrazione da Gemini 2.5 Pro a Gemini 3 Pro, puoi aspettarti miglioramenti significativi nel ragionamento di alto livello, nel rispetto di istruzioni complesse, nell'utilizzo degli strumenti, nei casi d'uso agentici e in una migliore capacità di contesto lungo (inclusa la comprensione di immagini e documenti). I modelli Gemini 3 Pro non sono progettati per dare la priorità al supporto dei casi d'uso di comprensione dell'audio o segmentazione delle immagini. Per un output ad alte prestazioni in questi casi d'uso, prova a utilizzare modelli creati appositamente per queste esigenze. Per grafici, tabelle o diagrammi densi di informazioni o complicati, il modello a volte può estrarre informazioni in modo errato o interpretare in modo errato le risorse fornite. La presentazione delle informazioni chiave nel modo più semplice possibile può contribuire a garantire l'output preferito quando si lavora con Gemini 3 Pro.
Modifiche al comportamento
Gemini 3 Pro è progettato per un'elevata efficienza e azione. Il modello è stato addestrato per fornire risposte concise e dirette e per tentare di risolvere l'intento dell'utente il più rapidamente possibile. Poiché il modello è progettato per dare la priorità all'utilità, a volte potrebbe indovinare quando mancano informazioni o dare la priorità a una risposta soddisfacente rispetto a istruzioni rigorose. Questo comportamento può essere mitigato o modificato con i prompt. Per ulteriori informazioni e best practice, vedi Inizia a utilizzare Gemini 3.
Nuove funzionalità
Gemini 3 Pro introduce diverse nuove funzionalità per migliorare le prestazioni, il controllo e la fedeltà multimodale:
- Livello di ragionamento: utilizza il parametro
thinking_levelper controllare la quantità di ragionamento interno eseguito dal modello (low o high) per bilanciare la qualità della risposta, la complessità del ragionamento, la latenza e il costo. Il parametrothinking_levelsostituiscethinking_budgetper i modelli Gemini 3. - Risoluzione dei contenuti multimediali: utilizza il parametro
media_resolution(low, medium o high) per controllare l'elaborazione della visione per gli input multimodali , influendo sull'utilizzo dei token e sulla latenza. Per le impostazioni di risoluzione predefinite, vedi Inizia a utilizzare Gemini 3. - Firme di ragionamento: una convalida più rigorosa delle firme di ragionamento migliora l'affidabilità nella chiamata di funzioni multi-turn.
- Risposte di funzioni multimodali: le risposte di funzioni ora possono includere oggetti multimodali come immagini e PDF, oltre al testo.
- Chiamata di funzioni in streaming: trasmetti in streaming gli argomenti di chiamata di funzioni parziali per migliorare l'esperienza utente durante l'utilizzo degli strumenti.
Per ulteriori informazioni sull'utilizzo di queste funzionalità, vedi Inizia a utilizzare Gemini 3.
Prova in Agent Platform Visualizza in Model Garden (anteprima) Esegui il deployment dell'app di esempio
| ID modello | gemini-3-pro-preview |
|
|---|---|---|
| Input e output supportati |
|
|
| Limiti di token |
|
|
| Funzionalità |
|
|
| Opzioni di consumo | ||
| Per ulteriori informazioni, vedi Opzioni di consumo. | ||
| Specifiche tecniche | ||
| Immagini |
|
|
| Documenti |
|
|
| Video |
|
|
| Audio |
|
|
| Valori predefiniti dei parametri |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
| Per ulteriori informazioni, vedi Deployment ed endpoint. | ||
| Data di knowledge cutoff | Gennaio 2025 | |
| Versioni |
|
|
| Lingue supportate | Vedi Lingue supportate. | |
| Prezzi | Vedi Prezzi. | |