Model DeepSeek

Model DeepSeek tersedia untuk digunakan sebagai API terkelola dan model yang di-deploy sendiri di Vertex AI. Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk melakukan streaming respons secara bertahap.

Model DeepSeek yang dikelola

Model DeepSeek menawarkan model serverless yang terkelola sepenuhnya sebagai API. Untuk menggunakan model DeepSeek di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Saat menggunakan model DeepSeek sebagai API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.

Model berikut tersedia dari DeepSeek untuk digunakan di Vertex AI. Untuk mengakses model DeepSeek, buka kartu modelnya di Model Garden.

DeepSeek-OCR

DeepSeek-OCR adalah model Pengenalan Karakter Optik (OCR) komprehensif yang menganalisis dan memahami dokumen kompleks. Model ini unggul dalam tugas OCR yang sulit, termasuk mengenali formula matematika dan memproses teks yang melengkung, diputar, atau tumpang-tindih.

Buka kartu model DeepSeek-OCR

DeepSeek-V3.2

DeepSeek-V3.2 adalah model yang menyelaraskan efisiensi komputasi tinggi dengan penalaran dan performa agen yang unggul. Pendekatan DeepSeek dibangun berdasarkan tiga terobosan teknis utama: DeepSeek Sparse Attention (DSA), framework reinforcement learning yang skalabel, dan pipeline sintesis tugas agentik berskala besar.

Buka kartu model DeepSeek-V3.2

DeepSeek-V3.1

DeepSeek-V3.1 adalah model hybrid yang mendukung mode berpikir dan mode non-berpikir. Dibandingkan dengan versi sebelumnya, upgrade ini menghadirkan peningkatan pada mode pemikiran hibrida, panggilan alat, dan efisiensi pemikiran.

Buka kartu model DeepSeek-V3.1

DeepSeek R1 (0528)

DeepSeek R1 (0528) adalah versi terbaru model DeepSeek R1. Dibandingkan dengan DeepSeek-R1, model ini telah meningkatkan kemampuan penalaran dan inferensi secara signifikan. DeepSeek R1 (0528) unggul dalam berbagai tugas, seperti penulisan kreatif, menjawab pertanyaan umum, pengeditan, dan peringkasan.

Pertimbangan

Untuk keamanan yang siap digunakan dalam produksi, integrasikan DeepSeek R1 (0528) dengan Model Armor, yang menyaring perintah dan respons LLM untuk berbagai risiko keamanan dan keselamatan.

Buka kartu model DeepSeek R1 (0528)

Menggunakan model DeepSeek

Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:

  • Untuk DeepSeek-OCR, gunakan deepseek-ocr-maas
  • Untuk DeepSeek-V3.2, gunakan deepseek-v3.2-maas
  • Untuk DeepSeek-V3.1, gunakan deepseek-v3.1-maas
  • Untuk DeepSeek R1 (0528), gunakan deepseek-r1-0528-maas

Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model DeepSeek, lihat Memanggil API model terbuka.

Untuk menggunakan model Vertex AI yang di-deploy sendiri:

  1. Buka konsol Model Garden.
  2. Temukan model Vertex AI yang relevan.
  3. Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.

Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .

Ketersediaan wilayah model DeepSeek

Model DeepSeek tersedia di region berikut:

Model Region
DeepSeek-OCR
  • us-central1
    • Output maks: 8.192
    • Panjang konteks: 8.192
DeepSeek-V3.2
  • global
    • Output maks: 65.536
    • Panjang konteks: 163.840
DeepSeek-V3.1
  • us-central1
    • Output maks: 32.768
    • Panjang konteks: 163.840
DeepSeek R1 (0528)
  • us-central1
    • Output maks: 32.768
    • Panjang konteks: 163.840

Langkah berikutnya

Pelajari cara Memanggil API model terbuka.