Modelli gestiti da Vertex AI per MaaS

Vertex AI supporta un elenco selezionato di modelli partner e open source come modelli gestiti. Questi modelli possono essere utilizzati con Vertex AI come model as a service (MaaS) e sono offerti come API gestita. Quando utilizzi un modello gestito, continui a inviare le richieste agli endpoint Vertex AI. I modelli gestiti sono serverless, quindi non è necessario eseguire il provisioning o gestire l'infrastruttura.

I modelli gestiti possono essere scoperti utilizzando Model Garden. Puoi anche eseguire il deployment dei modelli utilizzando Model Garden. Per ulteriori informazioni, consulta Esplora i modelli di AI in Model Garden.

Modelli di partner

I seguenti modelli partner sono offerti come API gestite su Vertex AI Model Garden (MaaS):

Nome modello Modalità Descrizione Guida rapida
Claude Sonnet 4.5 Lingua, Vista Il modello di medie dimensioni di Anthropic per alimentare agenti reali, con funzionalità di programmazione, utilizzo del computer, sicurezza informatica e gestione di file di Office come fogli di lavoro. Scheda del modello
Claude Opus 4.1 Lingua, Vista Un leader del settore per la programmazione. Offre prestazioni costanti per attività di lunga durata che richiedono impegno e migliaia di passaggi, ampliando in modo significativo ciò che gli agenti AI possono risolvere. Ideale per alimentare prodotti e funzionalità di agenti all'avanguardia. Scheda del modello
Claude Haiku 4.5 Lingua, Vista Claude Haiku 4.5 offre prestazioni quasi di frontiera per un'ampia gamma di casi d'uso e si distingue come uno dei migliori modelli di codifica al mondo, con la giusta velocità e il giusto costo per alimentare prodotti gratuiti ed esperienze utente ad alto volume. Scheda del modello
Claude Opus 4 Lingua, Vista Claude Opus 4 offre prestazioni costanti per attività di lunga durata che richiedono uno sforzo concentrato e migliaia di passaggi, ampliando notevolmente ciò che gli agenti AI possono risolvere. Scheda del modello
Claude Sonnet 4 Lingua, Vista Il modello di medie dimensioni di Anthropic con intelligenza superiore per utilizzi ad alto volume, come programmazione, ricerca approfondita e agenti. Scheda del modello
Claude 3.7 Sonnet di Anthropic Lingua, Vista Modello leader del settore per la programmazione e l'alimentazione di agenti AI e il primo modello Claude a offrire il ragionamento esteso. Scheda del modello
Claude 3.5 Sonnet v2 di Anthropic Lingua, Vista Claude 3.5 Sonnet aggiornato è un modello all'avanguardia per attività di ingegneria del software nel mondo reale e capacità agentiche. Claude 3.5 Sonnet offre questi miglioramenti allo stesso prezzo e alla stessa velocità del suo predecessore. Scheda del modello
Claude 3.5 Haiku di Anthropic Lingua, Vista Claude 3.5 Haiku, la nuova generazione del modello più veloce ed economico di Anthropic, è ottimale per i casi d'uso in cui velocità e convenienza sono importanti. Scheda del modello
Claude 3 Haiku di Anthropic Lingua Il modello di visione e testo più rapido di Anthropic per risposte quasi immediate a query di base, pensato per esperienze di AI senza interruzioni che imitano le interazioni umane. Scheda del modello
Claude 3.5 Sonnet di Anthropic Lingua Claude 3.5 Sonnet offre prestazioni migliori rispetto a Claude 3 Opus di Anthropic su un'ampia gamma di valutazioni di Anthropic con la velocità e il costo del modello di livello intermedio di Anthropic, Claude 3 Sonnet. Scheda del modello
Jamba 1.5 Large (anteprima) Lingua Jamba 1.5 Large di AI21 Labs è progettato per risposte di qualità superiore, throughput elevato e prezzi competitivi rispetto ad altri modelli della stessa classe di dimensioni. Scheda del modello
Jamba 1.5 Mini (anteprima) Lingua Jamba 1.5 Mini di AI21 Labs è ben bilanciato in termini di qualità, velocità effettiva e costi ridotti. Scheda del modello
Mistral Medium 3 Lingua Mistral Medium 3 è un modello versatile progettato per un'ampia gamma di attività, tra cui programmazione, ragionamento matematico, comprensione di documenti lunghi, riepilogo e dialogo. Scheda del modello
OCR Mistral (25/05) Lingua, Vista Mistral OCR (25.05) è un'API di riconoscimento ottico dei caratteri per la comprensione dei documenti. Il modello comprende ogni elemento dei documenti, come contenuti multimediali, testo, tabelle ed equazioni. Scheda del modello
Mistral Small 3.1 (25/03) Lingua Mistral Small 3.1 (25/03) è l'ultima versione del modello Small di Mistral, con funzionalità multimodali e lunghezza del contesto estesa. Scheda del modello
Mistral Large (24.11) Lingua Mistral Large (24.11) è la prossima versione del modello Mistral Large (24.07), ora con funzionalità di ragionamento e chiamata di funzioni migliorate. Scheda del modello
Codestral 2 Lingua, codice Codestral 2 è il modello specializzato di generazione di codice di Mistral creato appositamente per il completamento FIM (fill-in-the-middle) di alta precisione che aiuta gli sviluppatori a scrivere e interagire con il codice tramite un endpoint API di istruzioni e completamento condiviso. Scheda del modello
Codestral (25.01) Codice Un modello all'avanguardia progettato per la generazione di codice, incluso il completamento del codice e il riempimento del testo a metà. Scheda del modello

Modelli aperti

I seguenti modelli aperti sono offerti come API gestite su Vertex AI Model Garden (MaaS):

Nome modello Modalità Descrizione Guida rapida
gpt-oss 120B Lingua Un modello da 120 miliardi di parametri che offre prestazioni elevate per le attività di ragionamento. Scheda del modello
gpt-oss 20B Lingua Un modello da 20 miliardi di parametri ottimizzato per l'efficienza e l'implementazione su hardware di consumo e edge. Scheda del modello
Qwen3-Next-80B Thinking Lingua, codice Un modello della famiglia Qwen3-Next, specializzato nella risoluzione di problemi complessi e nel ragionamento approfondito. Scheda del modello
Qwen3-Next-80B Instruct Lingua, codice Un modello della famiglia Qwen3-Next, specializzato per l'esecuzione di comandi specifici. Scheda del modello
Qwen3 Coder Lingua, codice Un modello open-weight sviluppato per attività di sviluppo software avanzate. Scheda del modello
Qwen3 235B Lingua Un modello open-weight con una capacità di "pensiero ibrido" per passare dal ragionamento metodico alla conversazione rapida. Scheda del modello
DeepSeek-V3.1 Lingua Il modello ibrido di DeepSeek che supporta sia la modalità di pensiero che quella non di pensiero. Scheda del modello
DeepSeek R1 (0528) Lingua L'ultima versione del modello DeepSeek R1 di DeepSeek. Scheda del modello
Llama 4 Maverick 17B-128E Lingua, Vista Il modello Llama 4 più grande e potente, con capacità di programmazione, ragionamento e gestione delle immagini. Llama 4 Maverick 17B-128E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata. Scheda del modello
Llama 4 Scout 17B-16E Lingua, Vista Llama 4 Scout 17B-16E offre risultati all'avanguardia per la sua classe di dimensioni, superando le generazioni precedenti di Llama e altri modelli open source e proprietari in diversi benchmark. Llama 4 Scout 17B-16E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata. Scheda del modello
Llama 3.3 Lingua Llama 3.3 è un modello di 70 miliardi di parametri ottimizzato per le istruzioni solo testuali che offre prestazioni migliorate rispetto a Llama 3.1 70B e Llama 3.2 90B se utilizzato per applicazioni solo testuali. Inoltre, per alcune applicazioni, Llama 3.3 70B si avvicina alle prestazioni di Llama 3.1 405B. Scheda del modello
Llama 3.2 (anteprima) Lingua, Vista Un modello multimodale di medie dimensioni da 90 miliardi di parametri in grado di supportare il ragionamento sulle immagini, come l'analisi di grafici e diagrammi, nonché l'assegnazione di didascalie alle immagini. Scheda del modello
Llama 3.1 Lingua

Una raccolta di LLM multilingue ottimizzati per casi d'uso di dialoghi multilingue e che superano molti dei modelli di chat open source e chiusi disponibili nei benchmark comuni del settore.

Llama 3.1 405B è disponibile pubblicamente (GA).

Llama 3.1 8B e Llama 3.1 70B sono in anteprima.

Scheda del modello

Passaggi successivi