Selbst bereitgestellte Llama-Modelle

Llama ist eine Sammlung offener Modelle, die von Meta entwickelt wurden und die Sie in der Gemini Enterprise Agent Platform optimieren und bereitstellen können. Llama bietet vortrainierte und anhand von Anleitungen abgestimmte generative Text- und multimodale Modelle.

Llama 4

Die Llama 4-Modellfamilie besteht aus einer Sammlung multimodaler Modelle, die die MoE-Architektur (Mixture of Experts) verwenden. Durch die Verwendung der MoE-Architektur können Modelle mit einer sehr großen Anzahl von Parametern für jede Eingabe eine Teilmenge dieser Parameter aktivieren, was zu effizienteren Inferenzen führt. Außerdem wird bei Llama 4 die Early Fusion-Technik verwendet, bei der Text- und Bildinformationen aus den ersten Verarbeitungsphasen integriert werden. Mit dieser Methode können Llama 4-Modelle komplexe, differenzierte Beziehungen zwischen Text und Bildern effektiver erfassen. Model Garden auf der Gemini Enterprise Agent Platform bietet zwei Llama 4-Modelle: Llama 4 Scout und Llama 4 Maverick.

Weitere Informationen finden Sie auf der Llama 4-Modellkarte in Model Garden oder im Blogpost zur Einführung von Llama 4 auf der Gemini Enterprise Agent Platform.

Llama 4 Maverick

Llama 4 Maverick ist das größte und leistungsstärkste Llama 4-Modell und bietet branchenführende Funktionen für Programmierung, Problemlösung und Bild-Benchmarks. Es hat 17 Mrd. aktive Parameter von insgesamt 400 Mrd. Parametern mit 128 Experten. Llama 4 Maverick verwendet abwechselnd dichte und MoE-Layer. Bei jedem Token wird ein gemeinsamer Experte sowie einer der 128 weitergeleiteten Experten aktiviert. Sie können das Modell als vortrainiertes (PT) oder anweisungsabgestimmtes (IT) Modell mit FP8-Unterstützung verwenden. Das Modell wurde auf 200 Sprachen vortrainiert und durch eine optimierte Post-Training-Pipeline für hochwertige Chat-Interaktionen optimiert.

Llama 4 Maverick ist multimodal und hat eine Kontextlänge von 1 Million Tokens. Das Modell eignet sich für die erweiterte Bildunterschriftung, Analyse, präzise Bilderkennung, visuelle Frage-Antwort-Systeme, kreative Textgenerierung, KI-Assistenten für allgemeine Zwecke und anspruchsvolle Chatbots, die erstklassige Intelligenz und Bildverständnis erfordern.

Llama 4 Scout

Llama 4 Scout liefert für seine Größenklasse mit einem großen Kontextfenster von 10 Millionen Tokens modernste Ergebnisse und übertrifft bei mehreren Benchmarks frühere Llama-Generationen und andere offene und proprietäre Modelle. Es hat 17 Milliarden aktive Parameter von insgesamt 109 Milliarden Parametern mit 16 Experten und ist als vortrainiertes (PT) oder anweisungsoptimiertes (IT) Modell verfügbar. Llama 4 Scout eignet sich für Abrufvorgänge in langen Kontexten und Aufgaben, die eine Analyse großer Mengen an Informationen erfordern, z. B. das Zusammenfassen mehrerer großer Dokumente, die Analyse umfangreicher Protokolle von Nutzerinteraktionen zur Personalisierung und die Analyse großer Codebasen.

Llama 3.3

Llama 3.3 ist ein reines Textmodell mit 70 Milliarden Parametern, das auf Anweisungen abgestimmt ist und im Vergleich zu Llama 3.1 70B und Llama 3.2 90B eine höhere Leistung bei reinen Textanwendungen bietet. Außerdem erreicht Llama 3.3 70B bei einigen Anwendungen die Leistung von Llama 3.1 405B.

Weitere Informationen finden Sie auf der Modellkarte Llama 3.3 in Model Garden.

Llama 3.2

Mit Llama 3.2 können Entwickler die neuesten generativen KI-Modelle und ‑Anwendungen erstellen und bereitstellen, die die Funktionen von Llama nutzen, um neue Ideen zu entwickeln, z. B. Bildreasoning. Llama 3.2 ist außerdem für Anwendungen auf Geräten besser zugänglich. In der folgenden Liste sind die Funktionen von Llama 3.2 aufgeführt:

  • Bietet eine privatere und personalisiertere KI-Nutzung mit Verarbeitung auf dem Gerät für kleinere Modelle.
  • Es bietet Modelle, die effizienter sind, eine geringere Latenz aufweisen und eine bessere Leistung bieten. Dadurch eignen sie sich für eine Vielzahl von Anwendungen.
  • Basierend auf dem Llama-Stack, der das Erstellen und Bereitstellen von Anwendungen vereinfacht. Llama Stack ist eine standardisierte Schnittstelle zum Erstellen kanonischer Toolchain-Komponenten und Agent-Anwendungen.
  • Unterstützt Vision-Aufgaben mit einer neuen Modellarchitektur, die Bild-Encoder-Darstellungen in das Sprachmodell einbindet.

Die Modelle 1B und 3B sind schlanke Modelle für die reine Textverarbeitung, die Anwendungsfälle auf dem Gerät unterstützen, z. B. die mehrsprachige Abfrage von lokalem Wissen, Zusammenfassungen und Umformulierungen.

Die Modelle Llama 11B und 90B sind kleine und mittelgroße multimodale Modelle mit Bildreasoning. Sie können beispielsweise visuelle Daten aus Diagrammen analysieren, um genauere Antworten zu geben, und Details aus Bildern extrahieren, um Textbeschreibungen zu generieren.

Weitere Informationen finden Sie auf der Modellkarte Llama 3.2 in Model Garden.

Hinweise

Bei der Verwendung von 11B und 90B gibt es keine Einschränkungen beim Senden von Prompts, die nur aus Text bestehen. Wenn Sie jedoch ein Bild in Ihren Prompt aufnehmen, muss es sich am Anfang des Prompts befinden und Sie dürfen nur ein Bild hinzufügen. Sie können beispielsweise keinen Text und dann ein Bild einfügen.

Llama 3.1

Die Llama 3.1-Sammlung mehrsprachiger Large Language Models (LLMs) ist eine Sammlung vortrainierter und anweisungsorientierter generativer Modelle in den Größen 8B, 70B und 405B (Text-in/Text-Ausgang). Die Llama 3.1-Anweisungen abgestimmten Textmodelle (8B, 70B, 405B) sind für mehrsprachige Dialoganwendungsfälle optimiert und übertreffen viele der verfügbaren Open-Source- und geschlossenen Chatmodelle im Vergleich zu gängigen Branchen-Benchmarks.

Weitere Informationen finden Sie auf der Llama 3.1-Modellkarte in Model Garden.

Llama 3

Die anweisungsoptimierten Llama 3-Modelle sind eine Sammlung von LLMs, die für Dialoganwendungsfälle optimiert sind. Llama 3-Modelle schneiden bei gängigen Branchenbenchmarks besser ab als viele der verfügbaren Open-Source-Chatmodelle.

Weitere Informationen finden Sie auf der Llama 3-Modellkarte in Model Garden.

Llama 2

Die Llama 2-LLMs sind eine Sammlung vortrainierter und fein abgestimmter generativer Textmodelle mit einer Größe von 7 B bis 70 B Parametern.

Weitere Informationen finden Sie auf der Modellkarte Llama 2 in Model Garden.

Code Llama

Die Code Llama-Modelle von Meta sind für Codesynthese, -verständnis und -anweisungen konzipiert.

Weitere Informationen finden Sie auf der Modellkarte Code Lama in Model Garden.

Llama Guard 3

Llama Guard 3 baut auf den Funktionen von Llama Guard 2 auf und fügt drei neue Kategorien hinzu: Verleumdung, Wahlen und Missbrauch des Code Interpreters. Darüber hinaus ist dieses Modell mehrsprachig und hat ein Prompt-Format, das mit Llama 3- oder späteren Modellen übereinstimmt.

Weitere Informationen finden Sie auf der Modellkarte Llama Guard in Model Garden.

Ressourcen

Weitere Informationen zu Model Garden finden Sie unter KI-Modelle in Model Garden entdecken.