Model Garden memungkinkan Anda men-deploy sendiri model partner tertentu (pratinjau). Model yang di-deploy sendiri tidak bersifat serverless. Anda harus men-deploy-nya di Vertex AI sebelum menggunakannya. Model ini di-deploy dengan aman dalam Google Cloud project dan jaringan VPC Anda. Untuk mengetahui informasi selengkapnya tentang model yang di-deploy sendiri, lihat dokumentasi model yang di-deploy sendiri.
Membeli model partner yang dapat di-deploy sendiri
Untuk men-deploy model partner yang dapat di-deploy sendiri di Vertex AI, Anda harus membelinya terlebih dahulu melalui Google Cloud Marketplace. Untuk membeli model partner yang di-deploy sendiri, lakukan langkah-langkah berikut:
Buka Model Garden.
Di Koleksi model, klik Model partner yang dapat di-deploy sendiri untuk memfilter daftar model.
Klik kartu model partner yang ingin Anda beli.
Klik Hubungi bagian penjualan.
Isi formulir dan kirim permintaan Anda.
Setelah menyelesaikan langkah-langkah ini, Anda akan dihubungkan dengan Google Cloud perwakilan penjualan untuk menyelesaikan pembelian.
Men-deploy model
Setelah membeli model partner yang dapat di-deploy sendiri, Anda dapat men-deploy-nya ke Endpoint Vertex AI menggunakan deployment sekali klik. Proses ini menyederhanakan deployment dengan mengonfigurasi setelan yang diperlukan sebelumnya.
Anda dapat melakukan deployment sekali klik menggunakan konsol Google Cloud atau Vertex AI SDK untuk Python.
Konsol
Untuk men-deploy model partner di konsol Google Cloud , lakukan hal berikut:
Buka Model Garden.
Temukan dan klik kartu model partner yang ingin Anda gunakan.
Klik Deploy model.
Konfigurasi setelan deployment Anda seperti yang diminta.
Klik Deploy.
Python
Contoh berikut menunjukkan cara men-deploy model partner menggunakan Vertex AI SDK untuk Python. Ganti nilai placeholder dengan informasi spesifik Anda.
import vertexai
from vertexai import model_garden
vertexai.init(project="PROJECT_ID", location="LOCATION")
# Replace with the actual partner model ID from Model Garden
model = model_garden.OpenModel("PARTNER_MODEL_ID")
endpoint = model.deploy(
accept_eula=True,
machine_type="MACHINE_TYPE", # e.g., "a3-ultragpu-8g"
accelerator_type="ACCELERATOR_TYPE", # e.g., "NVIDIA_H200_141GB"
accelerator_count=ACCELERATOR_COUNT, # e.g., 8
serving_container_image_uri="SERVING_CONTAINER_IMAGE_URI",
endpoint_display_name="ENDPOINT_DISPLAY_NAME",
model_display_name="MODEL_DISPLAY_NAME",
use_dedicated_endpoint=True,
)
print(f"Model deployed to endpoint: {endpoint.resource_name}")
Langkah berikutnya
- Memilih opsi penayangan model terbuka
- Menggunakan model terbuka menggunakan Model sebagai Layanan (MaaS)
- Men-deploy model terbuka dengan container bawaan
- Men-deploy model terbuka dengan container vLLM kustom