Vertex AI è una piattaforma unificata e aperta per creare, eseguire il deployment e scalare modelli di AI generativa e machine learning (ML) e applicazioni AI. Fornisce l'accesso a Model Garden, che offre un catalogo curato di oltre 200 modelli, tra cui i modelli di base di Google (come Gemini) e una selezione completa di modelli open source e di partner, insieme all'infrastruttura TPU/GPU sottostante. Vertex AI supporta flussi di lavoro GenAI all'avanguardia, nonché flussi di lavoro di inferenza AI per MLOps. Offre strumenti MLOps end-to-end e controlli di livello aziendale per governance, sicurezza e conformità.
Funzionalità chiave di Vertex AI
Vertex AI include strumenti e servizi che supportano l'AI generativa, nonché i flussi di lavoro di inferenza AI e machine learning.
Funzionalità di AI generativa
Vertex AI riunisce un insieme completo di strumenti con quelli avanzati per i modelli di base di Google, che puoi utilizzare per creare agenti e applicazioni di AI generativa pronti per la produzione, come segue:
Prompt: inizia con la progettazione dei prompt in Vertex AI Studio. Vertex AI Studio include strumenti per la progettazione dei prompt e la gestione dei modelli che puoi utilizzare per prototipare, creare ed eseguire il deployment di applicazioni di AI generativa.
Modelli: Vertex AI Model Garden è un hub centralizzato che contiene oltre 200 modelli pronti per l'uso aziendale di Google, partner di terze parti leader (come Claude di Anthropic) e opzioni open source popolari (come Llama).
Questa selezione di modelli include quanto segue:
Modelli di AI generativa di base di Google:
- Gemini: funzionalità multimodali per testo, immagini, video e audio; e funzionalità di pensiero per i modelli, come Gemini 3 Flash e Gemini 3 Pro (con Nano Banana).
- Imagen su Vertex AI: genera e modifica immagini.
- Veo su Vertex AI: genera video da testo e immagini.
Modelli partner e open source: accedi a una selezione curata di modelli leader come Claude di Anthropic, i modelli di Mistral AI e Llama con un rapporto prezzo/prestazioni superiore. Questi modelli sono disponibili come API Model as a Service (MaaS) completamente gestite.
Personalizzazione dei modelli: personalizza i modelli in base alla tua attività per creare asset AI unici. Si va dall'integrazione con i dati aziendali o la Ricerca Google per ridurre le allucinazioni all'utilizzo di Vertex AI Training per l'ottimizzazione supervisionata (SFT) o l'ottimizzazione efficiente dei parametri (PEFT) di modelli come Gemini. Per ulteriori informazioni sulla personalizzazione del modello, consulta Introduzione all'ottimizzazione.
Valutazioni dell'AI generativa: valuta e confronta in modo oggettivo le prestazioni di modelli e agenti con le funzionalità di valutazione dell'AI generativa di Vertex AI. Garantisci la sicurezza e la conformità implementando funzionalità di difesa in fase di runtime come Model Armor per ispezionare e proteggere in modo proattivo dalle minacce emergenti, come prompt injection ed esfiltrazione di dati.
Agent Builder: Vertex AI Agent Builder è un sistema di trasformazione agente full-stack che ti aiuta a creare, gestire ed eseguire il deployment di agenti AI. Utilizza l'Agent Development Kit (ADK) open source per creare e orchestrare gli agenti, quindi esegui il deployment in Vertex AI Agent Engine gestito e serverless per l'utilizzo su larga fare lo scale in produzione. A ogni agente viene assegnata un'identità agente (principal di Identity and Access Management) per la sicurezza e una traccia di controllo chiara.
Accedi a informazioni esterne: migliora le risposte del modello connettendoti a fonti affidabili con il grounding, interagendo con API esterne utilizzando le chiamate di funzione e recuperando informazioni dalle knowledge base con RAG.
AI responsabile e sicurezza: utilizza le funzionalità di sicurezza integrate per bloccare i contenuti dannosi e garantire un utilizzo responsabile dell'AI.
Per saperne di più sull'AI generativa su Vertex AI, consulta la documentazione sull'AI generativa su Vertex AI.
Funzionalità di inferenza AI
Vertex AI fornisce strumenti e servizi che corrispondono a ogni fase del workflow ML:
Preparazione dei dati: raccogli, pulisci e trasforma i dati.
- Utilizza i blocchi note di Vertex AI Workbench per eseguire l'analisi esplorativa dei dati (EDA).
- Integrazione con Cloud Storage e BigQuery per l'accesso ai dati.
- Utilizza Dataproc Serverless Spark per l'elaborazione di dati su larga scala.
Addestramento del modello: addestra il modello ML.
- Scegli tra AutoML per l'addestramento senza codice o Addestramento personalizzato per il controllo completo.
- Gestisci e confronta le esecuzioni di addestramento utilizzando Vertex AI Experiments.
- Registra i modelli addestrati in Vertex AI Model Registry.
- Vertex AI Training
offre sia l'addestramento serverless sia i cluster di addestramento.
- Utilizza l'addestramento serverless di Vertex AI per eseguire il tuo codice di addestramento personalizzato on demand in un ambiente completamente gestito. Consulta la [panoramica dell'addestramento serverless di Vertex AI][serverless].
- Utilizza i cluster di addestramento Vertex AI per i job di grandi dimensioni che richiedono capacità garantita su cluster di acceleratori dedicati e riservati. Consulta la panoramica dei cluster di addestramento Vertex AI.
- Utilizza Ray su Vertex AI per scalare i carichi di lavoro Python e ML con il framework Ray open source su un cluster gestito e interattivo. Consulta la panoramica di Ray su Vertex AI.
- Utilizza Vertex AI Vizier per regolare gli iperparametri del modello in modelli ML complessi.
Valutazione e iterazione del modello: valuta e migliora le prestazioni del modello.
- Utilizza le metriche di valutazione del modello per confrontare i modelli.
- Integra le valutazioni nei flussi di lavoro di Vertex AI Pipelines.
Pubblicazione del modello: esegui il deployment e ottieni inferenze dal modello.
- Esegui il deployment per le inferenze online con container predefiniti o personalizzati.
- Esegui inferenze batch per set di dati di grandi dimensioni.
- Utilizza il runtime TensorFlow ottimizzato per un serving TensorFlow efficiente.
- Comprendi le inferenze del modello con Vertex Explainable AI.
- Pubblica le caratteristiche da Vertex AI Feature Store.
- Esegui il deployment dei modelli addestrati con BigQuery ML.
Monitoraggio del modello: monitora il rendimento del modello di cui è stato eseguito il deployment nel corso del tempo.
- Utilizza Vertex AI Model Monitoring per rilevare il disallineamento addestramento/produzione e la deviazione dell'inferenza.
Strumenti MLOps
Automatizza, gestisci e monitora i tuoi progetti di machine learning:
- Vertex AI Pipelines: orchestra e automatizza i flussi di lavoro ML come pipeline riutilizzabili.
- Vertex AI Model Registry: gestisci il ciclo di vita dei tuoi modelli ML, inclusi il controllo delle versioni e il deployment.
- Addestramento serverless Vertex AI: esegui il tuo codice di addestramento personalizzato on demand in un ambiente completamente gestito
- Vertex AI Model Monitoring: monitora i modelli di cui è stato eseguito il deployment per individuare disallineamenti e deviazioni dei dati per mantenere le prestazioni.
- Vertex AI Experiments: monitora e analizza diverse architetture e iperparametri del modello.
- Vertex AI Feature Store: gestisci e distribuisci i dati delle caratteristiche per l'addestramento dei modelli o per fare previsioni in tempo reale.
- Vertex ML Metadata: monitora e gestisci i metadati per gli artefatti ML.
- Cluster di addestramento Vertex AI: Addestra job su larga scala che richiedono capacità garantita su un cluster dedicato e riservato di acceleratori.
- Ray su Vertex AI: scala i workload Python e ML utilizzando il framework Ray open source su un cluster gestito e interattivo.
Passaggi successivi
- Scopri di più sull'AI generativa su Vertex AI.
- Scopri di più sulle funzionalità MLOps di Vertex AI.
- Esplora le interfacce che puoi utilizzare per interagire con Vertex AI.