DeepSeek-Modelle sind als verwaltete APIs und selbst bereitgestellte Modelle in Vertex AI verfügbar. Sie können Ihre Antworten streamen, um die vom Endnutzer wahrgenommene Latenz zu reduzieren. Eine gestreamte Antwort verwendet vom Server gesendete Ereignisse (SSE, Server-Sent Events), um die Antwort schrittweise zu streamen.
Verwaltete DeepSeek-Modelle
DeepSeek-Modelle bieten vollständig verwaltete und serverlose Modelle als APIs. Wenn Sie ein DeepSeek-Modell für Vertex AI verwenden möchten, senden Sie eine Anfrage direkt an den API-Endpunkt von Vertex AI. Wenn Sie DeepSeek-Modelle als verwaltete API verwenden, müssen Sie keine Infrastruktur bereitstellen oder verwalten.
Die folgenden Modelle sind von DeepSeek zur Verwendung in Vertex AI verfügbar. Rufen Sie die zugehörige Model Garden-Modellkarte auf, um auf ein DeepSeek-Modell zuzugreifen.
DeepSeek-OCR
DeepSeek-OCR ist ein umfassendes OCR-Modell (Optical Character Recognition, optische Zeichenerkennung), das komplexe Dokumente analysiert und versteht. Sie eignet sich hervorragend für anspruchsvolle OCR-Aufgaben, einschließlich der Erkennung mathematischer Formeln und der Verarbeitung von gekrümmtem, gedrehtem oder überlappendem Text.
Zur Modellkarte für DeepSeek-OCR gehenDeepSeek-V3.2
DeepSeek-V3.2 ist ein Modell, das hohe Recheneffizienz mit überlegener Problemlösungs- und Agentenleistung in Einklang bringt. Der Ansatz von DeepSeek basiert auf drei wichtigen technischen Durchbrüchen: DeepSeek Sparse Attention (DSA), einem skalierbaren Framework für Reinforcement Learning und einer Pipeline für die Synthese von Agent-Aufgaben im großen Maßstab.
Zur Modellkarte für DeepSeek-V3.2DeepSeek-V3.1
DeepSeek-V3.1 ist ein Hybridmodell, das sowohl den Thinking-Modus als auch den Nicht-Thinking-Modus unterstützt. Im Vergleich zur vorherigen Version bietet dieses Upgrade Verbesserungen bei hybriden Denkmodi, Tool-Aufrufen und der Effizienz von Denkprozessen.
Zur Modellkarte für DeepSeek-V3.1DeepSeek R1 (0528)
DeepSeek R1 (0528) ist die neueste Version des DeepSeek R1-Modells. Im Vergleich zu DeepSeek-R1 bietet es eine deutlich verbesserte Tiefe der Schlussfolgerungen und Inferenzfunktionen. DeepSeek R1 (0528) eignet sich hervorragend für eine Vielzahl von Aufgaben, z. B. für kreatives Schreiben, allgemeine Fragen und Antworten, Bearbeitung und Zusammenfassung.
Hinweise
Für produktionsreife Sicherheit integrieren Sie DeepSeek R1 (0528) mit Model Armor, das LLM-Prompts und ‑Antworten auf verschiedene Sicherheitsrisiken prüft.
Zur Modellkarte für DeepSeek R1 (0528)DeepSeek-Modelle verwenden
Für verwaltete Modelle können Sie curl-Befehle verwenden, um Anfragen mit den folgenden Modellnamen an den Vertex AI-Endpunkt zu senden:
- Für DeepSeek-OCR verwenden Sie
deepseek-ocr-maas - Verwenden Sie für DeepSeek-V3.2
deepseek-v3.2-maas. - Verwenden Sie für DeepSeek-V3.1
deepseek-v3.1-maas. - Verwenden Sie für DeepSeek R1 (0528)
deepseek-r1-0528-maas.
Informationen zum Ausführen von Streaming- und Nicht-Streaming-Aufrufen für DeepSeek-Modelle finden Sie unter APIs für offene Modelle aufrufen.
So verwenden Sie ein selbst bereitgestelltes Vertex AI-Modell:
- Rufen Sie die Model Garden-Konsole auf.
- Suchen Sie das entsprechende Vertex AI-Modell.
- Klicken Sie auf Aktivieren und füllen Sie das bereitgestellte Formular aus, um die erforderlichen Lizenzen für die kommerzielle Nutzung zu erhalten.
Weitere Informationen zum Bereitstellen und Verwenden von Partnermodellen finden Sie unter Partnermodell bereitstellen und Vorhersageanfragen stellen .
Regionale Verfügbarkeit von DeepSeek-Modellen
DeepSeek-Modelle sind in den folgenden Regionen verfügbar:
| Modell | Regionen |
|---|---|
| DeepSeek-OCR |
|
| DeepSeek-V3.2 |
|
| DeepSeek-V3.1 |
|
| DeepSeek R1 (0528) |
|
Nächste Schritte
Informationen zum Aufrufen von APIs für offene Modelle