Modelli aperti Vertex AI per MaaS

Vertex AI supporta un elenco curato di modelli aperti come modelli gestiti. Questi modelli aperti possono essere utilizzati con Vertex AI come model as a service (MaaS) e sono offerti come API gestita. Quando utilizzi un modello aperto gestito, continui a inviare le richieste agli endpoint Vertex AI. I modelli open gestiti sono serverless, quindi non è necessario eseguire il provisioning o gestire l'infrastruttura.

I modelli open source gestiti possono essere scoperti utilizzando Model Garden. Puoi anche eseguire il deployment dei modelli utilizzando Model Garden. Per saperne di più, consulta Esplora i modelli di AI in Model Garden.

Prima di poter utilizzare i modelli aperti, devi concedere l'accesso degli utenti ai modelli aperti.

Modelli aperti

I seguenti modelli aperti sono offerti come API gestite su Vertex AI Model Garden (MaaS):

Nome modello	Modalità	Descrizione	Guida rapida
DeepSeek-OCR	Lingua, Vista	Un modello completo di riconoscimento ottico dei caratteri (OCR) che analizza e comprende documenti complessi. È ideale per le attività OCR complesse.	Scheda del modello
DeepSeek R1 (0528)	Lingua	L'ultima versione del modello DeepSeek R1 di DeepSeek.	Scheda del modello
DeepSeek-V3.1	Lingua	Il modello ibrido di DeepSeek che supporta sia la modalità di pensiero che quella non di pensiero.	Scheda del modello
DeepSeek-V3.2	Lingua	Il modello di DeepSeek che armonizza l'elevata efficienza computazionale con prestazioni superiori di ragionamento e dell'agente.	Scheda del modello
GLM 4.7	Lingua, codice	Il modello di GLM progettato per la codifica di base o di vibrazioni, l'utilizzo di strumenti e il ragionamento complesso.	Scheda del modello
gpt-oss 120B	Lingua	Un modello da 120 miliardi di parametri che offre prestazioni elevate nelle attività di ragionamento.	Scheda del modello
gpt-oss 20B	Lingua	Un modello da 20 miliardi di parametri ottimizzato per l'efficienza e l'implementazione su hardware di consumo e edge.	Scheda del modello
Kimi K2 Thinking	Lingua	Un modello di agente di ragionamento open source che ragiona passo dopo passo e utilizza strumenti per risolvere problemi complessi.	Scheda del modello
Llama 3.1	Lingua	Una raccolta di LLM multilingue ottimizzati per casi d'uso di dialoghi multilingue e che superano molti dei modelli di chat open source e chiusi disponibili nei benchmark comuni del settore. Llama 3.1 405B è disponibile pubblicamente (GA). Llama 3.1 8B e Llama 3.1 70B sono in anteprima.	Scheda del modello
Llama 3.2 (anteprima)	Lingua, Vista	Un modello multimodale di medie dimensioni da 90 miliardi di parametri in grado di supportare il ragionamento sulle immagini, come l'analisi di grafici e diagrammi, nonché l'assegnazione di didascalie alle immagini.	Scheda del modello
Llama 3.3	Lingua	Llama 3.3 è un modello di 70 miliardi di parametri ottimizzato per le istruzioni solo testuali che offre prestazioni migliorate rispetto a Llama 3.1 70B e Llama 3.2 90B se utilizzato per applicazioni solo testuali. Inoltre, per alcune applicazioni, Llama 3.3 70B si avvicina alle prestazioni di Llama 3.1 405B.	Scheda del modello
Llama 4 Maverick 17B-128E	Lingua, Vista	Il modello Llama 4 più grande e potente, con capacità di programmazione, ragionamento e gestione delle immagini. Llama 4 Maverick 17B-128E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata.	Scheda del modello
Llama 4 Scout 17B-16E	Lingua, Vista	Llama 4 Scout 17B-16E offre risultati all'avanguardia per la sua classe di dimensioni, superando le generazioni precedenti di Llama e altri modelli open source e proprietari in diversi benchmark. Llama 4 Scout 17B-16E è un modello multimodale che utilizza l'architettura Mixture-of-Experts (MoE) e la fusione anticipata.	Scheda del modello
MiniMax M2	Lingua, codice	Progettato per attività agentiche e correlate al codice con ottime capacità di pianificazione ed esecuzione di attività complesse di chiamata di strumenti.	Scheda del modello
Qwen3 235B	Lingua	Un modello open-weight con una capacità di "pensiero ibrido" per passare dal ragionamento metodico alla conversazione rapida.	Scheda del modello
Qwen3 Coder	Lingua, codice	Un modello open-weight sviluppato per attività di sviluppo software avanzate.	Scheda del modello
Qwen3-Next-80B Instruct	Lingua, codice	Un modello della famiglia Qwen3-Next, specializzato nell'esecuzione di comandi specifici.	Scheda del modello
Qwen3-Next-80B Thinking	Lingua, codice	Un modello della famiglia Qwen3-Next, specializzato nella risoluzione di problemi complessi e nel ragionamento approfondito.	Scheda del modello

I seguenti modelli di incorporamento aperti sono offerti come API gestite su Vertex AI Model Garden (MaaS):

Nome modello	Descrizione	Dimensioni di output	Lunghezza massima della sequenza	Lingue di testo supportate	Guida rapida
multilingual-e5-small	Parte della famiglia E5 di modelli di text embedding. La variante Small contiene 12 livelli.	Fino a 384	512 token	Lingue supportate	Scheda del modello
multilingual-e5-large	Parte della famiglia E5 di modelli di text embedding. La variante Large contiene 24 livelli.	Fino a 1024	512 token	Lingue supportate	Scheda del modello

Conformità normativa del modello aperto

Le certificazioni per l'AI generativa su Vertex AI continuano a essere applicate quando i modelli aperti vengono utilizzati come API gestita utilizzando Vertex AI. Se hai bisogno di dettagli sui modelli stessi, puoi trovare ulteriori informazioni nella scheda del modello corrispondente oppure puoi contattare il publisher del modello.

I tuoi dati vengono archiviati at-rest all'interno della regione o della multiregione selezionata per i modelli aperti su Vertex AI, ma la regionalizzazione del trattamento dei dati può variare. Per un elenco dettagliato degli impegni di trattamento dei dati dei modelli aperti, consulta Residenza dei dati per i modelli aperti.

I prompt dei clienti e le risposte del modello non vengono condivisi con terze parti quando si utilizza l'API Vertex AI, inclusi i modelli aperti. Google tratta i dati dei clienti solo in base alle istruzioni del cliente, come descritto più nel dettaglio nel nostro Addendum per il trattamento dei dati Cloud.

Passaggi successivi

Prima di utilizzare i modelli aperti, concedi agli utenti l'accesso ai modelli aperti.
Scopri come chiamare le API dei modelli aperti.

Modelli aperti Vertex AI per MaaS Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Modelli aperti

Conformità normativa del modello aperto

Passaggi successivi

Modelli aperti Vertex AI per MaaS