DeepSeek-Modelle

DeepSeek-Modelle sind als verwaltete APIs und selbst bereitgestellte Modelle auf der Gemini Enterprise Agent Platform verfügbar. Sie können Ihre Antworten streamen, um die vom Endnutzer wahrgenommene Latenz zu reduzieren. Eine gestreamte Antwort verwendet vom Server gesendete Ereignisse (SSE, Server-Sent Events), um die Antwort schrittweise zu streamen.

Verwaltete DeepSeek-Modelle

DeepSeek-Modelle bieten vollständig verwaltete und serverlose Modelle als APIs. Wenn Sie ein DeepSeek-Modell in der Agent Platform verwenden möchten, senden Sie eine Anfrage direkt an den API-Endpunkt der Agent Platform. Wenn Sie DeepSeek-Modelle als verwaltete API verwenden, müssen Sie keine Infrastruktur bereitstellen oder verwalten.

Die folgenden Modelle sind von DeepSeek zur Verwendung in der Gemini Enterprise Agent Platform verfügbar. Rufen Sie die zugehörige Model Garden-Modellkarte auf, um auf ein DeepSeek-Modell zuzugreifen.

DeepSeek-OCR

DeepSeek-OCR ist ein umfassendes OCR-Modell (Optical Character Recognition, optische Zeichenerkennung), das komplexe Dokumente analysiert und versteht. Sie eignet sich hervorragend für anspruchsvolle OCR-Aufgaben, einschließlich der Erkennung mathematischer Formeln und der Verarbeitung von gekrümmtem, gedrehtem oder überlappendem Text.

Zur Modellkarte für DeepSeek-OCR gehen

DeepSeek-V3.2

DeepSeek-V3.2 ist ein Modell, das hohe Recheneffizienz mit überlegener Problemlösungs- und Agentenleistung in Einklang bringt. Der Ansatz von DeepSeek basiert auf drei wichtigen technischen Durchbrüchen: DeepSeek Sparse Attention (DSA), einem skalierbaren Framework für Reinforcement Learning und einer Pipeline für die Synthese von Agent-Aufgaben im großen Maßstab.

Zur Modellkarte für DeepSeek-V3.2

DeepSeek-V3.1

DeepSeek-V3.1 ist ein Hybridmodell, das sowohl den Thinking-Modus als auch den Nicht-Thinking-Modus unterstützt. Im Vergleich zur vorherigen Version bietet dieses Upgrade Verbesserungen bei hybriden Denkmodi, Tool-Aufrufen und der Effizienz des Denkprozesses.

Zur Modellkarte für DeepSeek-V3.1

DeepSeek R1 (0528)

DeepSeek R1 (0528) ist die neueste Version des DeepSeek R1-Modells. Im Vergleich zu DeepSeek-R1 bietet es eine deutlich verbesserte Tiefe der Schlussfolgerungen und Inferenzfunktionen. DeepSeek R1 (0528) eignet sich hervorragend für eine Vielzahl von Aufgaben, z. B. kreatives Schreiben, allgemeine Fragen und Antworten, Bearbeitung und Zusammenfassung.

Hinweise

Für produktionsreife Sicherheit integrieren Sie DeepSeek R1 (0528) mit Model Armor, das LLM-Prompts und ‑Antworten auf verschiedene Sicherheitsrisiken prüft.

Zur Modellkarte für DeepSeek R1 (0528)

DeepSeek-Modelle verwenden

Bei verwalteten Modellen können Sie curl-Befehle verwenden, um Anfragen mit den folgenden Modellnamen an den Gemini Enterprise Agent Platform-Endpunkt zu senden:

  • Für DeepSeek-OCR verwenden Sie deepseek-ocr-maas
  • Verwenden Sie für DeepSeek-V3.2 deepseek-v3.2-maas.
  • Verwenden Sie für DeepSeek-V3.1 deepseek-v3.1-maas.
  • Verwenden Sie für DeepSeek R1 (0528) deepseek-r1-0528-maas.

Informationen zum Ausführen von Streaming- und Nicht-Streaming-Aufrufen für DeepSeek-Modelle finden Sie unter Open-Model-APIs aufrufen.

So verwenden Sie ein selbst bereitgestelltes Gemini Enterprise Agent Platform-Modell:

  1. Rufen Sie die Model Garden-Konsole auf.
  2. Suchen Sie das entsprechende Modell der Gemini Enterprise Agent Platform.
  3. Klicken Sie auf Aktivieren und füllen Sie das bereitgestellte Formular aus, um die erforderlichen Lizenzen für die kommerzielle Nutzung zu erhalten.

Weitere Informationen zum Bereitstellen und Verwenden von Partnermodellen finden Sie unter Partnermodell bereitstellen und Vorhersageanfragen stellen .

Regionale Verfügbarkeit von DeepSeek-Modellen

DeepSeek-Modelle sind in den folgenden Regionen verfügbar:

Modell Regionen
DeepSeek-OCR
  • us-central1
    • Maximale Ausgabe: 8.192
    • Kontextlänge: 8.192
DeepSeek-V3.2
  • global
    • Max. Ausgabe: 65.536
    • Kontextlänge: 163.840
DeepSeek-V3.1
  • us-central1
    • Maximale Ausgabe: 32.768
    • Kontextlänge: 163.840
DeepSeek R1 (0528)
  • us-central1
    • Maximale Ausgabe: 32.768
    • Kontextlänge: 163.840

Nächste Schritte

Informationen zum Aufrufen von APIs für offene Modelle