Model Qwen

Model Qwen di Vertex AI menawarkan model terkelola sepenuhnya dan tanpa server sebagai API. Untuk menggunakan model Qwen di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Qwen menggunakan API terkelola, tidak perlu menyediakan atau mengelola infrastruktur.

Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.

Model Qwen yang tersedia

Model berikut tersedia dari Qwen untuk digunakan di Vertex AI. Untuk mengakses model Qwen, buka kartu model Model Garden-nya.

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct adalah model bahasa dari keluarga model Qwen3-Next. Model ini dirancang untuk mengikuti perintah tertentu dan menangani teks yang sangat panjang. Model ini menggunakan desain cerdas yang disebut Mixture-of-Experts (MoE), yang mengaktifkan subset parameter yang tersedia untuk memproses informasi, sehingga model ini berjalan lebih cepat dan lebih hemat biaya daripada model lain dengan ukuran yang sama.

Versi Instruct disetel untuk memberikan jawaban langsung yang andal dalam aplikasi chat dan agen, serta jendela konteksnya yang besar memungkinkannya mempertahankan seluruh percakapan atau dokumen besar dalam memori.

Buka kartu model Qwen3-Next-80B Instruct

Pemikiran Qwen3-Next-80B

Qwen3-Next-80B Thinking adalah model bahasa dari keluarga model Qwen3-Next. Model ini dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. Mode "berpikir"-nya menghasilkan proses penalaran langkah demi langkah yang terlihat bersama dengan jawaban akhir, sehingga ideal untuk tugas yang memerlukan logika transparan, seperti bukti matematika, pen-debug-an kode yang rumit, atau perencanaan agen multi-langkah.

Buka kartu model Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) adalah model open-weight berskala besar yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Fitur utama model ini adalah jendela konteksnya yang besar, sehingga memungkinkan model memproses dan memahami codebase besar secara komprehensif.

Buka kartu model Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) adalah model parameter besar 235B. Model ini dibedakan oleh kemampuan "pemikiran hibrida", yang memungkinkan pengguna beralih secara dinamis antara mode "pemikiran" langkah demi langkah yang metodis untuk tugas-tugas kompleks seperti penalaran matematika dan coding, serta mode "non-pemikiran" yang cepat untuk percakapan umum. Jendela konteksnya yang besar membuatnya cocok untuk kasus penggunaan yang memerlukan penalaran mendalam dan pemahaman panjang.

Buka kartu model Qwen3 235B

Menggunakan model Qwen

Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model Qwen, lihat Memanggil API model terbuka.

Langkah berikutnya