Einstellung von Modellen (MaaS)

Nach einer gewissen Zeit werden MaaS-Modelle eingestellt und in der Regel durch neuere Modellversionen ersetzt. Damit Sie genügend Zeit haben, neuere Modelle zu testen und zu migrieren, werden auf dieser Seite alle eingestellten Modelle zusammen mit dem Datum der Einstellung aufgeführt.

Claude 3.7 Sonnet

Claude 3.7 Sonnet wurde am 11. November 2025 eingestellt und wird am 11. Mai 2026 abgeschaltet. Claude 3.7 Sonnet ist nur für Bestandskunden verfügbar.

Claude 3.7 Sonnet ist ein hochmodernes Modell für reale Softwareentwicklungsaufgaben und für von KI-Agenten zu übernehmende Aufgaben.

Modell-ID claude-3-7-sonnet@20250219
Startphase Veraltet
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 200.000
  • Maximale Ausgabetokens: 128.000
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Einschränkungen und Spezifikationen: Siehe Vision in der Dokumentation von Anthropic
Dokumente
  • Einschränkungen und Spezifikationen: Siehe PDF-Unterstützung in der Dokumentation von Anthropic
Wissensstichtag November 2024
Versionen
  • claude-3-7-sonnet@20250219
    • Einführungsphase:Eingestellt
    • Veröffentlichungsdatum:20. März 2025
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

  • USA
    • us-east5
  • Europa
    • europe-west1
  • Global
    • global endpoint

ML-Verarbeitung

  • USA
    • Multi-region
  • Europa
    • Multi-region
Kontingentlimits

us-east5:

  • QPM: 55
  • TPM: 500.000 (ohne Cache für Ein- und Ausgabe)
  • Kontextlänge: 200.000

europe-west1:

  • QPM: 40
  • TPM: 300.000 (Eingabe und Ausgabe ohne Cache)
  • Kontextlänge: 200.000

Globaler Endpunkt:

  • QPM: 35
  • TPM: 300.000 (Eingabe und Ausgabe ohne Cache)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.

Codestral (25.01)

Codestral (25.01) wird seit dem 23. Oktober 2025 nicht mehr unterstützt und am 23. Januar 2026 eingestellt. Codestral (25.01) ist nur für Bestandskunden verfügbar.

Ein hochmodernes Modell, das für die Codegenerierung entwickelt wurde, einschließlich Fill-in-the-Middle und Codevervollständigung.

Modellkarte in Model Garden ansehen

Modell-ID codestral-2501
Startphase Veraltet
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code
  • Ausgaben:
    Text
Nutzungstypen
Versionen
  • codestral-2501
    • Einführungsphase:GA
    • Veröffentlichungsdatum:13. Januar 2025
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
  • Europa
    • europe-west4

ML-Verarbeitung

  • USA
    • Multi-region
  • Europa
    • Multi-region
Kontingentlimits

us-central1:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 32.000

europe-west4:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 32.000

Preise Weitere Informationen finden Sie unter Preise.

Mistral Large (24.11)

Mistral Large (24.11) wird ab dem 23. Oktober 2025 nicht mehr unterstützt und am 23. Januar 2026 eingestellt. Mistral Large (24.11) ist nur für Bestandskunden verfügbar.

Mistral Large (24.11) ist eine Version des Large-Modells von Mistral mit verbesserten Funktionen für das Ziehen von Schlussfolgerungen und Funktionsaufrufe.

Modellkarte in Model Garden ansehen

Modell-ID mistral-large-2411
Startphase Veraltet
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code
  • Ausgaben:
    Text
Nutzungstypen
Versionen
  • mistral-large-2411
    • Einführungsphase:GA
    • Veröffentlichungsdatum:21. November 2024
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
  • Europa
    • europe-west4

ML-Verarbeitung

  • USA
    • Multi-region
  • Europa
    • Multi-region
Kontingentlimits

us-central1:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 128.000

europe-west4:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 128.000

Preise Weitere Informationen finden Sie unter Preise.

Claude 3.5 Sonnet v2

Claude 3.5 Sonnet v2 wird am 20. August 2025 eingestellt und am 19. Februar 2026 deaktiviert. Claude 3.5 Sonnet v2 ist nur für Bestandskunden verfügbar.

Claude 3.5 Sonnet v2 ist ein hochmodernes Modell für reale Softwareentwicklungsaufgaben und für von KI-Agenten zu übernehmende Aufgaben.

In Vertex AI ausprobieren

Modell-ID claude-3-5-sonnet-v2@20241022
Startphase GA
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 200.000
  • Maximale Ausgabetokens: 8.000
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Einschränkungen und Spezifikationen: Siehe Vision in der Dokumentation von Anthropic
Dokumente
  • Einschränkungen und Spezifikationen: Siehe PDF-Unterstützung in der Dokumentation von Anthropic
Wissensstichtag August 2024
Versionen
  • claude-3-5-sonnet-v2@20241022
    • Einführungsphase: Allgemein verfügbar
    • Veröffentlichungsdatum:22. Oktober 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

  • USA
    • us-east5
  • Europa
    • europe-west1
  • Global
    • global endpoint

ML-Verarbeitung

  • USA
    • Multi-region
  • Europa
    • Multi-region
Kontingentlimits

us-east5:

  • QPM: 90
  • TPM: 540.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

europe-west1:

  • QPM: 55
  • TPM: 330.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

Globaler Endpunkt:

  • QPM: 25
  • TPM: 140.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.

Claude 3.5 Sonett

Claude 3.5 Sonnet wird seit dem 20. August 2025 nicht mehr unterstützt und am 19. Februar 2026 eingestellt. Claude 3.5 Sonnet ist nur für Bestandskunden verfügbar.

Claude 3.5 Sonnet übertrifft Claude 3 Opus von Anthropic in einer Vielzahl von Bewertungen von Anthropic mit der Geschwindigkeit und den Kosten des Mid-Tier-Modells von Anthropic, Claude 3 Sonnet.

Modell-ID claude-3-5-sonnet@20240620
Startphase GA
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 200.000
  • Maximale Ausgabetokens: 8.000
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Einschränkungen und Spezifikationen: Siehe Vision in der Dokumentation von Anthropic
Dokumente
  • Einschränkungen und Spezifikationen: Siehe PDF-Unterstützung in der Dokumentation von Anthropic
Wissensstichtag April 2024
Versionen
  • claude-3-5-sonnet@20240620
    • Einführungsphase: Allgemein verfügbar
    • Veröffentlichungsdatum:20. Juni 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

  • USA
    • us-east5
  • Europa
    • europe-west1
  • Asiatisch-pazifischer Raum
    • asia-southeast1

ML-Verarbeitung

  • USA
    • Multi-region
  • Europa
    • Multi-region
  • Asiatisch-pazifischer Raum
    • asia-southeast1
Kontingentlimits

us-east5:

  • QPM: 80
  • TPM: 350.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

europe-west1:

  • QPM: 130
  • TPM: 600.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

asia-southeast1:

  • QPM: 35
  • TPM: 150.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.

Jamba 1.5 Large

Jamba 1.5 Large wird am 27. August 2025 eingestellt und am 27. Februar 2026 deaktiviert. Jamba 1.5 Large ist nur für Bestandskunden verfügbar.

Jamba 1.5 Large von AI21 Labs bietet ein gutes Gleichgewicht zwischen Qualität, Durchsatz und niedrigen Kosten.

Modellkarte in Model Garden ansehen

Modell-ID jamba-1.5-large
Startphase Vorschau
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Dokumente
  • Ausgaben:
    Text
Nutzungstypen
Wissensstichtag März 2024
Versionen
  • jamba-1.5-large
    • Einführungsphase:Vorabversion
    • Veröffentlichungsdatum:22. August 2024
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
  • Europa
    • europe-west4

ML-Verarbeitung

  • USA
    • Multi-region
Kontingentlimits

us-central1:

  • Abfragen pro Minute: 20
  • TPM: 20.000
  • Kontextlänge: 256.000

europe-west4:

  • Abfragen pro Minute: 20
  • TPM: 20.000
  • Kontextlänge: 256.000

Preise Weitere Informationen finden Sie unter Preise.

Jamba 1.5 Mini

Jamba 1.5 Mini wird am 27. August 2025 eingestellt und am 27. Februar 2026 deaktiviert. Jamba 1.5 Mini ist nur für bestehende Kunden verfügbar.

Jamba 1.5 Mini von AI21 Labs bietet ein gutes Gleichgewicht zwischen Qualität, Durchsatz und niedrigen Kosten.

Modellkarte in Model Garden ansehen

Modell-ID jamba-1.5-mini
Startphase Vorschau
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Dokumente
  • Ausgaben:
    Text
Nutzungstypen
Wissensstichtag März 2024
Versionen
  • jamba-1.5-mini
    • Einführungsphase:Vorabversion
    • Veröffentlichungsdatum:22. August 2024
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
  • Europa
    • europe-west4

ML-Verarbeitung

  • USA
    • Multi-region
Kontingentlimits

us-central1:

  • QPM: 50
  • TPM: 60.000
  • Kontextlänge: 256.000

europe-west4:

  • QPM: 50
  • TPM: 60.000
  • Kontextlänge: 256.000

Preise Weitere Informationen finden Sie unter Preise.

Claude 3 Opus

Claude 3 Opus von Anthropic wird seit dem 30. Juni 2025 nicht mehr unterstützt und am 1. August 2025 eingestellt. Claude 3 Opus ist nur für Bestandskunden verfügbar.

Claude 3 Opus von Anthropic ist ein leistungsstarkes KI-Modell, das bei hochkomplexen Aufgaben Top-Level-Leistung bietet. Sie ist beeindruckend fließend und menschenähnliche Kenntnisse, um mit offenen Prompts und ungesehenen Szenarien zurechtzukommen. Claude 3 Opus ist für die folgenden Anwendungsfälle optimiert:

  • Aufgabenautomatisierung, z. B. interaktives Programmieren und Planen oder Ausführen komplexer Aktionen über APIs und Datenbanken hinweg.

  • Aufgaben im Bereich Forschung und Entwicklung, z. B. Recherche, Brainstorming, Hypothesenentwicklung und Produkttests.

  • Strategieaufgaben wie erweiterte Analysen von Diagrammen, Finanzdaten und Markttrends sowie Prognosen.

  • Vision-Aufgaben, z. B. die Verarbeitung von Bildern, um eine Textausgabe zurückzugeben. Außerdem können Diagramme, Grafiken, technische Diagramme, Berichte und andere visuelle Inhalte analysiert werden.

Modell-ID claude-3-opus@20240229
Startphase Veraltet
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 200.000
  • Maximale Ausgabetokens: 8.000
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Einschränkungen und Spezifikationen: Siehe Vision in der Dokumentation von Anthropic
Dokumente
  • Einschränkungen und Spezifikationen: Siehe PDF-Unterstützung in der Dokumentation von Anthropic
Wissensstichtag August 2023
Versionen
  • claude-3-opus@20240229
    • Einführungsphase:Eingestellt
    • Veröffentlichungsdatum:31. Mai 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

  • USA
    • us-east5

ML-Verarbeitung

  • USA
    • Multi-region
Kontingentlimits

us-east5:

  • QPM: 20
  • TPM: 105.000 (Eingabe und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.