Vertex AI supporta un elenco selezionato di modelli partner e open source come modelli gestiti. Questi modelli possono essere utilizzati con Vertex AI come model as a service (MaaS) e sono offerti come API gestita. Quando utilizzi un modello gestito, continui a inviare le richieste agli endpoint Vertex AI. I modelli gestiti sono serverless, quindi non è necessario eseguire il provisioning o gestire l'infrastruttura.
I modelli gestiti possono essere scoperti utilizzando Model Garden. Puoi anche eseguire il deployment dei modelli utilizzando Model Garden. Per ulteriori informazioni, consulta Esplora i modelli di AI in Model Garden.
Modelli di partner
I seguenti modelli partner sono offerti come API gestite su Vertex AI Model Garden (MaaS):
Nome modello | Modalità | Descrizione | Guida rapida |
---|---|---|---|
Claude Sonnet 4.5 | Lingua, Vista | Il modello di medie dimensioni di Anthropic per alimentare agenti reali, con funzionalità di programmazione, utilizzo del computer, sicurezza informatica e gestione di file di Office come fogli di lavoro. | Scheda del modello |
Claude Opus 4.1 | Lingua, Vista | Un leader del settore per la programmazione. Offre prestazioni costanti per attività di lunga durata che richiedono impegno e migliaia di passaggi, ampliando in modo significativo ciò che gli agenti AI possono risolvere. Ideale per alimentare prodotti e funzionalità di agenti all'avanguardia. | Scheda del modello |
Claude Haiku 4.5 | Lingua, Vista | Claude Haiku 4.5 offre prestazioni quasi di frontiera per un'ampia gamma di casi d'uso e si distingue come uno dei migliori modelli di codifica al mondo, con la giusta velocità e il giusto costo per alimentare prodotti gratuiti ed esperienze utente ad alto volume. | Scheda del modello |
Claude Opus 4 | Lingua, Vista | Claude Opus 4 offre prestazioni costanti per attività di lunga durata che richiedono uno sforzo concentrato e migliaia di passaggi, ampliando notevolmente ciò che gli agenti AI possono risolvere. | Scheda del modello |
Claude Sonnet 4 | Lingua, Vista | Il modello di medie dimensioni di Anthropic con intelligenza superiore per utilizzi ad alto volume, come programmazione, ricerca approfondita e agenti. | Scheda del modello |
Claude 3.7 Sonnet di Anthropic | Lingua, Vista | Modello leader del settore per la programmazione e l'alimentazione di agenti AI e il primo modello Claude a offrire il ragionamento esteso. | Scheda del modello |
Claude 3.5 Sonnet v2 di Anthropic | Lingua, Vista | Claude 3.5 Sonnet aggiornato è un modello all'avanguardia per attività di ingegneria del software nel mondo reale e capacità agentiche. Claude 3.5 Sonnet offre questi miglioramenti allo stesso prezzo e alla stessa velocità del suo predecessore. | Scheda del modello |
Claude 3.5 Haiku di Anthropic | Lingua, Vista | Claude 3.5 Haiku, la nuova generazione del modello più veloce ed economico di Anthropic, è ottimale per i casi d'uso in cui velocità e convenienza sono importanti. | Scheda del modello |
Claude 3 Haiku di Anthropic | Lingua | Il modello di visione e testo più rapido di Anthropic per risposte quasi immediate a query di base, pensato per esperienze di AI senza interruzioni che imitano le interazioni umane. | Scheda del modello |
Claude 3.5 Sonnet di Anthropic | Lingua | Claude 3.5 Sonnet offre prestazioni migliori rispetto a Claude 3 Opus di Anthropic su un'ampia gamma di valutazioni di Anthropic con la velocità e il costo del modello di livello intermedio di Anthropic, Claude 3 Sonnet. | Scheda del modello |
Jamba 1.5 Large (anteprima) | Lingua | Jamba 1.5 Large di AI21 Labs è progettato per risposte di qualità superiore, throughput elevato e prezzi competitivi rispetto ad altri modelli della stessa classe di dimensioni. | Scheda del modello |
Jamba 1.5 Mini (anteprima) | Lingua | Jamba 1.5 Mini di AI21 Labs è ben bilanciato in termini di qualità, velocità effettiva e costi ridotti. | Scheda del modello |
Mistral Medium 3 | Lingua | Mistral Medium 3 è un modello versatile progettato per un'ampia gamma di attività, tra cui programmazione, ragionamento matematico, comprensione di documenti lunghi, riepilogo e dialogo. | Scheda del modello |
OCR Mistral (25/05) | Lingua, Vista | Mistral OCR (25.05) è un'API di riconoscimento ottico dei caratteri per la comprensione dei documenti. Il modello comprende ogni elemento dei documenti, come contenuti multimediali, testo, tabelle ed equazioni. | Scheda del modello |
Mistral Small 3.1 (25/03) | Lingua | Mistral Small 3.1 (25/03) è l'ultima versione del modello Small di Mistral, con funzionalità multimodali e lunghezza del contesto estesa. | Scheda del modello |
Mistral Large (24.11) | Lingua | Mistral Large (24.11) è la prossima versione del modello Mistral Large (24.07), ora con funzionalità di ragionamento e chiamata di funzioni migliorate. | Scheda del modello |
Codestral 2 | Lingua, codice | Codestral 2 è il modello specializzato di generazione di codice di Mistral creato appositamente per il completamento FIM (fill-in-the-middle) di alta precisione che aiuta gli sviluppatori a scrivere e interagire con il codice tramite un endpoint API di istruzioni e completamento condiviso. | Scheda del modello |
Codestral (25.01) | Codice | Un modello all'avanguardia progettato per la generazione di codice, incluso il completamento del codice e il riempimento del testo a metà. | Scheda del modello |
Modelli aperti
I seguenti modelli aperti sono offerti come API gestite su Vertex AI Model Garden (MaaS):
Nome modello | Modalità | Descrizione | Guida rapida |
---|---|---|---|
gpt-oss 120B | Lingua | Un modello da 120 miliardi di parametri che offre prestazioni elevate per le attività di ragionamento. | Scheda del modello |
gpt-oss 20B | Lingua | Un modello da 20 miliardi di parametri ottimizzato per l'efficienza e l'implementazione su hardware di consumo e edge. | Scheda del modello |
Qwen3-Next-80B Thinking | Lingua, codice | Un modello della famiglia Qwen3-Next, specializzato nella risoluzione di problemi complessi e nel ragionamento approfondito. | Scheda del modello |
Qwen3-Next-80B Instruct | Lingua, codice | Un modello della famiglia Qwen3-Next, specializzato per l'esecuzione di comandi specifici. | Scheda del modello |
Qwen3 Coder | Lingua, codice | Un modello open-weight sviluppato per attività di sviluppo software avanzate. | Scheda del modello |
Qwen3 235B | Lingua | Un modello open-weight con una capacità di "pensiero ibrido" per passare dal ragionamento metodico alla conversazione rapida. | Scheda del modello |
DeepSeek-V3.1 | Lingua | Il modello ibrido di DeepSeek che supporta sia la modalità di pensiero che quella non di pensiero. | Scheda del modello |
DeepSeek R1 (0528) | Lingua | L'ultima versione del modello DeepSeek R1 di DeepSeek. | Scheda del modello |
Llama 4 Maverick 17B-128E | Lingua, Vista | Il modello Llama 4 più grande e potente, con capacità di programmazione, ragionamento e gestione delle immagini. Llama 4 Maverick 17B-128E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata. | Scheda del modello |
Llama 4 Scout 17B-16E | Lingua, Vista | Llama 4 Scout 17B-16E offre risultati all'avanguardia per la sua classe di dimensioni, superando le generazioni precedenti di Llama e altri modelli open source e proprietari in diversi benchmark. Llama 4 Scout 17B-16E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata. | Scheda del modello |
Llama 3.3 | Lingua | Llama 3.3 è un modello di 70 miliardi di parametri ottimizzato per le istruzioni solo testuali che offre prestazioni migliorate rispetto a Llama 3.1 70B e Llama 3.2 90B se utilizzato per applicazioni solo testuali. Inoltre, per alcune applicazioni, Llama 3.3 70B si avvicina alle prestazioni di Llama 3.1 405B. | Scheda del modello |
Llama 3.2 (anteprima) | Lingua, Vista | Un modello multimodale di medie dimensioni da 90 miliardi di parametri in grado di supportare il ragionamento sulle immagini, come l'analisi di grafici e diagrammi, nonché l'assegnazione di didascalie alle immagini. | Scheda del modello |
Llama 3.1 | Lingua |
Una raccolta di LLM multilingue ottimizzati per casi d'uso di dialoghi multilingue e che superano molti dei modelli di chat open source e chiusi disponibili nei benchmark comuni del settore. Llama 3.1 405B è disponibile pubblicamente (GA). Llama 3.1 8B e Llama 3.1 70B sono in anteprima. |
Scheda del modello |
Passaggi successivi
- Scopri di più sui modelli aperti di Vertex AI per MaaS.
- Scopri come chiamare le API per modelli aperti.