Model Garden è una libreria di modelli di AI/ML che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset di Google e dei suoi partner.
Vantaggi di Model Garden
Quando lavori con i modelli di AI, Model Garden offre i seguenti vantaggi:
- Tutti i modelli disponibili sono raggruppati in un'unica posizione
- Model Garden fornisce un pattern di deployment coerente per diversi tipi di modelli
- Model Garden fornisce un'integrazione integrata con altre parti di Gemini Enterprise Agent Platform, come l'ottimizzazione, la valutazione e l'erogazione dei modelli
- L'erogazione di modelli di AI generativa può essere difficile: Gemini Enterprise Agent Platform gestisce il deployment e l'erogazione dei modelli per te
Esplora i modelli
Per visualizzare l'elenco dei modelli della piattaforma agentica Gemini Enterprise e open source (di base, ottimizzabili e specifici per le attività) disponibili, vai alla pagina Model Garden nella Google Cloud console.
Le categorie dei modelli disponibili in Model Garden sono:
| Categoria | Descrizione |
|---|---|
| Modelli di base | Modelli di grandi dimensioni preaddestrati e multitasking che possono essere ottimizzati o personalizzati per attività specifiche mediante Agent Studio, l'API Agent Platform e l' SDK Agent Platform. |
| Modelli ottimizzabili | Modelli che possono essere ottimizzati mediante una pipeline o un notebook personalizzati. |
| Soluzioni specifiche per le attività | La maggior parte di questi modelli predefiniti può essere usata subito. Molti possono essere personalizzati usando i tuoi dati. |
Per filtrare i modelli nel riquadro dei filtri, specifica quanto segue:
- Attività: fai clic sull'attività che vuoi che il modello esegua.
- Raccolte di modelli: fai clic per scegliere i modelli gestiti da Google, dai partner o da te.
- Provider: fai clic sul provider del modello.
- Funzionalità: fai clic sulle funzionalità che vuoi nel modello.
Per saperne di più su ogni modello, fai clic sulla relativa scheda del modello.
Scansione di sicurezza dei modelli
Google esegue test e benchmark approfonditi sui container di erogazione e ottimizzazione che forniamo. Viene applicata anche la scansione attiva delle vulnerabilità agli artefatti dei container.
I modelli di terze parti dei partner in primo piano vengono sottoposti a scansioni dei checkpoint dei modelli per garantirne l'autenticità. I modelli di terze parti di HuggingFace Hub vengono scansionati direttamente da HuggingFace e dal relativo scanner di terze parti per rilevare malware, file pickle, livelli Keras Lambda e secret. I modelli ritenuti non sicuri da queste scansioni vengono contrassegnati da HuggingFace e il deployment viene bloccato in Model Garden. I modelli ritenuti sospetti o che hanno la capacità di eseguire potenzialmente codice remoto sono indicati in Model Garden, ma possono comunque essere sottoposti a deployment. Ti consigliamo di esaminare attentamente qualsiasi modello sospetto prima di eseguirne il deployment in Model Garden.
Prezzi
Per i modelli open source in Model Garden, ti vengono addebitati i seguenti utilizzi su Gemini Enterprise Agent Platform:
- Ottimizzazione dei modelli: ti vengono addebitate le risorse di calcolo utilizzate alla stessa tariffa dell'addestramento personalizzato. Consulta i prezzi dell'addestramento personalizzato.
- Deployment dei modelli: ti vengono addebitate le risorse di calcolo utilizzate per eseguire il deployment del modello in un endpoint. Consulta i prezzi delle previsioni.
- Colab Enterprise: consulta i prezzi di Colab Enterprise.
Controllare l'accesso a modelli specifici
Puoi impostare una policy dell'organizzazione di Model Garden policy a livello di organizzazione, cartella o progetto per controllare l'accesso a modelli specifici in Model Garden. Ad esempio, puoi consentire l'accesso a modelli specifici che hai verificato e negare l'accesso a tutti gli altri.
Scopri di più su Model Garden
Per saperne di più sulle opzioni di deployment e sulle personalizzazioni che puoi eseguire con i modelli in Model Garden, consulta le risorse nelle sezioni seguenti, che includono link a tutorial, riferimenti, notebook e video di YouTube.
Esegui il deployment ed eroga
Scopri di più sulla personalizzazione dei deployment e sulle funzionalità di erogazione avanzate.
- Esegui il deployment e l'erogazione di un modello open source utilizzando l'SDK Python, l'interfaccia a riga di comando, l'API REST o la console
- Deploying and fine-tuning Gemma 3 in Model Garden YouTube video
- Deployment di Gemma e formulazione di previsioni
- Eroga modelli aperti con un container Hex-LLM su Cloud TPU
- Notebook del tutorial sul deployment dei modelli Llama utilizzando Hex-LLM
- Notebook del tutorial sull'utilizzo della memorizzazione nella cache dei prefissi e della decodifica speculativa con Hex-LLM o vLLM
- Utilizza vLLM per erogare modelli linguistici solo testuali e multimodali nelle Cloud GPU
- Utilizza il container xDiT di erogazione delle GPU per la generazione di immagini e video
- Come erogare Gemma 2 con più adattatori LoRA e DLC HuggingFace per l'inferenza PyTorch (tutorial su Medium)
- Utilizza i gestori personalizzati per erogare PaliGemma per le didascalie delle immagini con HuggingFace DLC per l'inferenza PyTorch (tutorial su LinkedIn)
- Esegui il deployment e l'erogazione di un modello che utilizza VM spot o un notebook del tutorial sulle prenotazioni di Compute Engine
- Esegui il deployment e l'erogazione di un modello Hugging Face
Ottimizzazione
Scopri di più sull'ottimizzazione dei modelli per personalizzare le risposte per casi d'uso specifici.
- Notebook del tutorial sull'ottimizzazione di Workbench
- Notebook del tutorial su ottimizzazione e valutazione
- Deploying and fine-tuning Gemma 3 in Model Garden YouTube video
Valutazione
Scopri di più sulla valutazione delle risposte dei modelli con Agent Platform
Risorse aggiuntive
- Notebook di Model Garden specifici per il modello e il percorso dell'utente
- Notebook per l'erogazione del modello, l'ottimizzazione e la valutazione di modelli aperti di Gemini Enterprise Agent Platform