Selbst bereitgestellte Llama-Modelle

Llama ist eine Sammlung offener Modelle, die von Meta entwickelt wurden und die Sie in der Gemini Enterprise Agent Platform optimieren und bereitstellen können. Llama bietet vortrainierte und anhand von Anleitungen abgestimmte generative Text- und multimodale Modelle.

Llama 4

Die Llama 4-Modellfamilie ist eine Sammlung multimodaler Modelle, die die MoE-Architektur (Mixture-of-Experts) verwenden. Durch die Verwendung der MoE-Architektur können Modelle mit einer sehr großen Anzahl von Parametern eine Teilmenge dieser Parameter für eine bestimmte Eingabe aktivieren, was zu effizienteren Inferenzvorgängen führt. Außerdem verwendet Llama 4 die Early Fusion, bei der Text- und Bildinformationen aus den ersten Verarbeitungsphasen integriert werden. Mit dieser Methode können Llama 4-Modelle komplexe, differenzierte Beziehungen zwischen Text und Bildern effektiver erfassen. Model Garden in der Gemini Enterprise Agent Platform bietet zwei Llama 4-Modelle: Llama 4 Scout und Llama 4 Maverick.

Weitere Informationen finden Sie auf der Modellkarte Llama 4 in Model Garden oder im Introducing Llama 4 on Gemini Enterprise Agent Platform Blogpost.

Llama 4 Maverick

Llama 4 Maverick ist das größte und leistungsstärkste Llama 4-Modell und bietet branchenführende Funktionen für das Programmieren, Reasoning und Bild-Benchmarks. Es verfügt über 17 Milliarden aktive Parameter von insgesamt 400 Milliarden Parametern mit 128 Experten. Llama 4 Maverick verwendet abwechselnd dichte und MoE-Ebenen, wobei jedes Token einen gemeinsamen Experten und einen der 128 weitergeleiteten Experten aktiviert. Sie können das Modell als vortrainiertes (PT) oder anhand von Anleitungen abgestimmtes (IT) Modell mit FP8-Unterstützung verwenden. Das Modell ist in 200 Sprachen vortrainiert und durch eine optimierte Post-Training-Pipeline für hochwertige Chat-Interaktionen optimiert.

Llama 4 Maverick ist multimodal und hat eine Kontextlänge von 1 Million. Es eignet sich für erweiterte Bildunterschriften, Analysen, präzises Bildverständnis, visuelle Fragen und Antworten, kreative Texterstellung, universelle KI-Assistenten und anspruchsvolle Chatbots, die erstklassige Intelligenz und Bildverständnis erfordern.

Llama 4 Scout

Llama 4 Scout liefert für seine Größenklasse erstklassige Ergebnisse mit einem großen Kontextfenster von 10 Millionen Tokens und übertrifft frühere Llama-Generationen und andere offene und proprietäre Modelle in mehreren Benchmarks. Es verfügt über 17 Milliarden aktive Parameter von insgesamt 109 Milliarden Parametern mit 16 Experten und ist als vortrainiertes (PT) oder anhand von Anleitungen abgestimmtes (IT) Modell verfügbar. Llama 4 Scout eignet sich für Abrufanfragen in langen Kontexten und für Aufgaben, die Reasoning über große Informationsmengen erfordern, z. B. das Zusammenfassen mehrerer großer Dokumente, die Analyse umfangreicher Protokolle von Nutzerinteraktionen zur Personalisierung und das Reasoning über große Codebasen.

Llama 3.3

Llama 3.3 ist ein anhand von Anleitungen abgestimmtes 70B-Modell für die reine Textverarbeitung, das im Vergleich zu Llama 3.1 70B und Llama 3.2 90B eine höhere Leistung bietet, wenn es für Anwendungen verwendet wird, die nur Text verarbeiten. Außerdem erreicht Llama 3.3 70B bei einigen Anwendungen die Leistung von Llama 3.1 405B.

Weitere Informationen finden Sie auf der Llama 3.3 Modellkarte in Model Garden.

Llama 3.2

Mit Llama 3.2 können Entwickler die neuesten generativen KI-Modelle und ‑Anwendungen erstellen und bereitstellen, die die Funktionen von Llama nutzen, um neue Ideen zu entwickeln, z. B. Bildreasoning. Llama 3.2 ist außerdem für Anwendungen auf Geräten besser zugänglich. Die folgende Liste enthält die Funktionen von Llama 3.2:

  • Bietet eine privatere und personalisiertere KI-Nutzung mit Verarbeitung auf dem Gerät für kleinere Modelle.
  • Bietet Modelle, die effizienter sind, mit geringerer Latenz und verbesserter Leistung, wodurch sie sich für eine Vielzahl von Anwendungen eignen.
  • Basiert auf dem Llama Stack, der die Entwicklung und Bereitstellung von Anwendungen erleichtert. Llama Stack ist eine standardisierte Schnittstelle zum Erstellen kanonischer Toolchain-Komponenten und agentenbasierter Anwendungen.
  • Unterstützt Vision-Aufgaben mit einer neuen Modellarchitektur, die Bild-Encoder-Darstellungen in das Sprachmodell einbindet.

Die Modelle 1B und 3B sind schlanke Modelle für die reine Textverarbeitung, die Anwendungsfälle auf dem Gerät unterstützen, z. B. die mehrsprachige Abfrage von lokalem Wissen, Zusammenfassungen und Umformulierungen.

Die Modelle Llama 11B und 90B sind kleine und mittelgroße multimodale Modelle mit Bildreasoning. Sie können beispielsweise visuelle Daten aus Diagrammen analysieren, um genauere Antworten zu geben, und Details aus Bildern extrahieren, um Textbeschreibungen zu generieren.

Weitere Informationen finden Sie auf der Modellkarte Llama 3.2 in Model Garden.

Hinweise

Bei der Verwendung von 11B und 90B gibt es keine Einschränkungen beim Senden von Prompts, die nur aus Text bestehen. Wenn Sie jedoch ein Bild in Ihren Prompt aufnehmen, muss es sich am Anfang des Prompts befinden und Sie dürfen nur ein Bild hinzufügen. Sie können beispielsweise keinen Text und dann ein Bild einfügen.

Llama 3.1

Die Llama 3.1-Sammlung mehrsprachiger Large Language Models (LLMs) ist eine Sammlung vortrainierter und anweisungsorientierter generativer Modelle in den Größen 8B, 70B und 405B (Text-in/Text-Ausgang). Die Llama 3.1-Anweisungen abgestimmten Textmodelle (8B, 70B, 405B) sind für mehrsprachige Dialoganwendungsfälle optimiert und übertreffen viele der verfügbaren Open-Source- und geschlossenen Chatmodelle im Vergleich zu gängigen Branchen-Benchmarks.

Weitere Informationen finden Sie auf der Llama 3.1-Modellkarte in Model Garden.

Llama 3

Die anweisungsoptimierten Llama 3-Modelle sind eine Sammlung von LLMs, die für Dialoganwendungsfälle optimiert sind. Llama 3-Modelle schneiden bei gängigen Branchenbenchmarks besser ab als viele der verfügbaren Open-Source-Chatmodelle.

Weitere Informationen finden Sie auf der Llama 3-Modellkarte in Model Garden.

Llama 2

Die Llama 2-LLMs sind eine Sammlung vortrainierter und fein abgestimmter generativer Textmodelle mit einer Größe von 7 B bis 70 B Parametern.

Weitere Informationen finden Sie auf der Modellkarte Llama 2 in Model Garden.

Code Llama

Die Code Llama-Modelle von Meta sind für Codesynthese, -verständnis und -anweisungen konzipiert.

Weitere Informationen finden Sie auf der Modellkarte Code Lama in Model Garden.

Llama Guard 3

Llama Guard 3 baut auf den Funktionen von Llama Guard 2 auf und fügt drei neue Kategorien hinzu: Verleumdung, Wahlen und Missbrauch des Code Interpreters. Darüber hinaus ist dieses Modell mehrsprachig und hat ein Prompt-Format, das mit Llama 3- oder späteren Modellen übereinstimmt.

Weitere Informationen finden Sie auf der Modellkarte Llama Guard in Model Garden.

Ressourcen

Weitere Informationen zu Model Garden finden Sie unter KI-Modelle in Model Garden entdecken.