Modelli Llama con deployment autonomo

Llama è una raccolta di modelli aperti sviluppati da Meta che puoi ottimizzare ed eseguire il deployment sulla piattaforma Gemini Enterprise Agent. Llama offre modelli di testo generativo e multimodali preaddestrati e ottimizzati per le istruzioni.

Llama 4

La famiglia di modelli Llama 4 è una raccolta di modelli multimodali che utilizzano l'architettura Mixture-of-Experts (MoE). Utilizzando l'architettura MoE, i modelli con un numero molto elevato di parametri possono attivare un sottoinsieme di questi parametri per qualsiasi input, il che porta a inferenze più efficienti. Inoltre, Llama 4 utilizza la fusione anticipata, che integra le informazioni di testo e visive dalle fasi di elaborazione iniziali. Questo metodo consente ai modelli Llama 4 di comprendere in modo più efficace le relazioni complesse e sfumate tra testo e immagini. Model Garden sulla piattaforma Gemini Enterprise Agent offre due modelli Llama 4: Llama 4 Scout e Llama 4 Maverick.

Per ulteriori informazioni, consulta la scheda del modello Llama 4 in Model Garden o leggi il post del blog Introducing Llama 4 on Gemini Enterprise Agent Platform.

Lama 4 Maverick

Llama 4 Maverick è il modello Llama 4 più grande e potente, che offre funzionalità leader del settore per la programmazione, il ragionamento e i benchmark delle immagini. che dispone di 17 miliardi di parametri attivi su un totale di 400 miliardi con 128 esperti. Llama 4 Maverick utilizza livelli densi e MoE alternati, in cui ogni token attiva un esperto condiviso più uno dei 128 esperti instradati. Puoi utilizzare il modello come modello preaddestrato (PT) o ottimizzato per le istruzioni (IT) con supporto FP8. Il modello è preaddestrato su 200 lingue e ottimizzato per interazioni di chat di alta qualità tramite una pipeline di post-training perfezionata.

Llama 4 Maverick è multimodale e ha una finestra contestuale di 1 milione di token. È adatto per la generazione avanzata di didascalie per immagini, l'analisi, la comprensione precisa delle immagini, le domande e risposte visive, la generazione di testi creativi, gli assistenti AI generici e i chatbot sofisticati che richiedono intelligenza e comprensione delle immagini di primo livello.

Llama 4 Scout

Llama 4 Scout offre risultati all'avanguardia per la sua classe di dimensioni con un'ampia finestra contestuale di 10 milioni di token, superando le generazioni precedenti di Llama e altri modelli aperti e proprietari in diversi benchmark. Dispone di 17 miliardi di parametri attivi su un totale di 109 miliardi di parametri con 16 esperti ed è disponibile come modello preaddestrato (PT) o ottimizzato per le istruzioni (IT). Llama 4 Scout è adatto per attività di recupero all'interno di contesti lunghi e attività che richiedono ragionamenti su grandi quantità di informazioni, come il riepilogo di più documenti di grandi dimensioni, l'analisi di log di interazione utente estesi per la personalizzazione e il ragionamento in codebase di grandi dimensioni.

Llama 3.3

Llama 3.3 è un modello di 70 miliardi di parametri ottimizzato per le istruzioni solo testuali che offre prestazioni migliorate rispetto a Llama 3.1 70B e Llama 3.2 90B se utilizzato per applicazioni solo testuali. Inoltre, per alcune applicazioni, Llama 3.3 70B si avvicina alle prestazioni di Llama 3.1 405B.

Per ulteriori informazioni, consulta la scheda del modello Llama 3.3 in Model Garden.

Llama 3.2

Llama 3.2 consente agli sviluppatori di creare e implementare i più recenti modelli e applicazioni di AI generativa che utilizzano le funzionalità di Llama per dare il via a nuove innovazioni, come il ragionamento sulle immagini. Llama 3.2 è progettato anche per essere più accessibile per le applicazioni sul dispositivo. Il seguente elenco evidenzia le funzionalità di Llama 3.2:

  • Offre un'esperienza AI più privata e personalizzata, con elaborazione sul dispositivo per i modelli più piccoli.
  • Offre modelli progettati per essere più efficienti, con latenza ridotta e prestazioni migliorate, il che li rende adatti a un'ampia gamma di applicazioni.
  • Basato su Llama Stack, che semplifica la creazione e il deployment delle applicazioni. Llama Stack è un'interfaccia standardizzata per la creazione di componenti della toolchain canonici e applicazioni agentiche.
  • Supporta le attività di visione, con una nuova architettura del modello che integra le rappresentazioni del codificatore di immagini nel modello linguistico.

I modelli da 1 miliardo e 3 miliardi sono modelli leggeri solo testuali che supportano casi d'uso sul dispositivo, come il recupero di conoscenze locali multilingue, il riepilogo e la riscrittura.

I modelli Llama 11B e 90B sono modelli multimodali di piccole e medie dimensioni con ragionamento delle immagini. Ad esempio, possono analizzare i dati visivi dei grafici per fornire risposte più accurate ed estrarre dettagli dalle immagini per generare descrizioni di testo.

Per ulteriori informazioni, consulta la scheda del modello Llama 3.2 in Model Garden.

Considerazioni

Quando utilizzi 11B e 90B, non ci sono restrizioni quando invii prompt solo di testo. Tuttavia, se includi un'immagine nel prompt, questa deve trovarsi all'inizio del prompt e puoi includere una sola immagine. Ad esempio, non puoi includere del testo e poi un'immagine.

Llama 3.1

La raccolta di modelli linguistici di grandi dimensioni (LLM) multilingue Llama 3.1 è una raccolta di modelli generativi preaddestrati e ottimizzati per le istruzioni nelle dimensioni 8B, 70B e 405B (testo in/testo out). I modelli solo testuali ottimizzati per le istruzioni Llama 3.1 (8 miliardi, 70 miliardi, 405 miliardi) sono ottimizzati per i casi d'uso di dialogo multilingue e superano molti dei modelli di chat open source e chiusi disponibili nei benchmark comuni del settore.

Per ulteriori informazioni, consulta la scheda del modello Llama 3.1 in Model Garden.

Llama 3

I modelli Llama 3 ottimizzati per le istruzioni sono una raccolta di LLM ottimizzati per i casi d'uso di dialogo. I modelli Llama 3 superano molti modelli di chat open source disponibili nei benchmark comuni del settore.

Per ulteriori informazioni, consulta la scheda del modello Llama 3 in Model Garden.

Llama 2

Gli LLM Llama 2 sono una raccolta di modelli di testo generativi preaddestrati e ottimizzati, con dimensioni che variano da 7 miliardi a 70 miliardi di parametri.

Per ulteriori informazioni, consulta la scheda del modello Llama 2 in Model Garden.

Code Llama

I modelli Code Llama di Meta sono progettati per la sintesi, la comprensione e le istruzioni del codice.

Per ulteriori informazioni, consulta la sezione Codice Scheda del modello Llama in Model Garden.

Llama Guard 3

Llama Guard 3 sfrutta le capacità di Llama Guard 2, aggiungendo tre nuove categorie: Diffamazione, Elezioni e Abuso dell'Interprete di codice. Inoltre, questo modello è multilingue e ha un formato di prompt che in modo coerente con i modelli Llama 3 o successivi.

Per ulteriori informazioni, consulta la scheda del modello Llama Guard in Model Garden.

Risorse

Per ulteriori informazioni su Model Garden, consulta Esplora i modelli di AI in Model Garden.