Model DeepSeek tersedia untuk digunakan sebagai API terkelola dan model yang di-deploy sendiri di Vertex AI. Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk melakukan streaming respons secara bertahap.
Model DeepSeek yang dikelola
Model DeepSeek menawarkan model serverless yang terkelola sepenuhnya sebagai API. Untuk menggunakan model DeepSeek di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Saat menggunakan model DeepSeek sebagai API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.
Model berikut tersedia dari DeepSeek untuk digunakan di Vertex AI. Untuk mengakses model DeepSeek, buka kartu modelnya di Model Garden.
DeepSeek-OCR
DeepSeek-OCR adalah model Pengenalan Karakter Optik (OCR) komprehensif yang menganalisis dan memahami dokumen kompleks. Model ini unggul dalam tugas OCR yang sulit, termasuk mengenali formula matematika dan memproses teks yang melengkung, diputar, atau tumpang-tindih.
Buka kartu model DeepSeek-OCRDeepSeek-V3.2
DeepSeek-V3.2 adalah model yang menyelaraskan efisiensi komputasi tinggi dengan penalaran dan performa agen yang unggul. Pendekatan DeepSeek dibangun berdasarkan tiga terobosan teknis utama: DeepSeek Sparse Attention (DSA), framework reinforcement learning yang skalabel, dan pipeline sintesis tugas agentik berskala besar.
Buka kartu model DeepSeek-V3.2DeepSeek-V3.1
DeepSeek-V3.1 adalah model hybrid yang mendukung mode berpikir dan mode non-berpikir. Dibandingkan dengan versi sebelumnya, upgrade ini menghadirkan peningkatan pada mode pemikiran hibrida, panggilan alat, dan efisiensi pemikiran.
Buka kartu model DeepSeek-V3.1DeepSeek R1 (0528)
DeepSeek R1 (0528) adalah versi terbaru model DeepSeek R1. Dibandingkan dengan DeepSeek-R1, model ini telah meningkatkan kemampuan penalaran dan inferensi secara signifikan. DeepSeek R1 (0528) unggul dalam berbagai tugas, seperti penulisan kreatif, menjawab pertanyaan umum, pengeditan, dan peringkasan.
Pertimbangan
Untuk keamanan yang siap digunakan dalam produksi, integrasikan DeepSeek R1 (0528) dengan Model Armor, yang menyaring perintah dan respons LLM untuk berbagai risiko keamanan dan keselamatan.
Buka kartu model DeepSeek R1 (0528)Menggunakan model DeepSeek
Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:
- Untuk DeepSeek-OCR, gunakan
deepseek-ocr-maas - Untuk DeepSeek-V3.2, gunakan
deepseek-v3.2-maas - Untuk DeepSeek-V3.1, gunakan
deepseek-v3.1-maas - Untuk DeepSeek R1 (0528), gunakan
deepseek-r1-0528-maas
Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model DeepSeek, lihat Memanggil API model terbuka.
Untuk menggunakan model Vertex AI yang di-deploy sendiri:
- Buka konsol Model Garden.
- Temukan model Vertex AI yang relevan.
- Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.
Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .
Ketersediaan wilayah model DeepSeek
Model DeepSeek tersedia di region berikut:
| Model | Region |
|---|---|
| DeepSeek-OCR |
|
| DeepSeek-V3.2 |
|
| DeepSeek-V3.1 |
|
| DeepSeek R1 (0528) |
|
Langkah berikutnya
Pelajari cara Memanggil API model terbuka.