Model Garden adalah library model AI/ML yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model dan aset dari Google dan partner Google.
Keuntungan Model Garden
Saat Anda menggunakan model AI, Model Garden memberikan keuntungan berikut:
- Semua model yang tersedia dikelompokkan di satu lokasi
- Model Garden menyediakan pola deployment yang konsisten untuk berbagai jenis model
- Model Garden menyediakan integrasi bawaan dengan bagian lain dari Gemini Enterprise Agent Platform seperti penyesuaian model, evaluasi, dan penayangan
- Menayangkan model AI generatif dapat menjadi sulit—Platform Agen Gemini Enterprise menangani deployment dan penayangan model untuk Anda
Mempelajari model
Untuk melihat daftar model dasar, model yang dapat disesuaikan, dan model khusus tugas open source dan Gemini Enterprise Agent Platform yang tersedia, buka halaman Model Garden di Google Cloud konsol.
Kategori model yang tersedia di Model Garden adalah:
| Kategori | Deskripsi |
|---|---|
| Model dasar | Model besar multitasking terlatih yang dapat dimodifikasi atau disesuaikan untuk tugas tertentu menggunakan Agent Studio, Agent Platform API, dan Agent Platform SDK. |
| Model yang dapat disesuaikan | Model yang dapat Anda sesuaikan menggunakan notebook atau pipeline kustom. |
| Solusi khusus tugas | Sebagian besar model bawaan ini siap digunakan. Banyak di antaranya yang dapat disesuaikan menggunakan data Anda sendiri. |
Untuk memfilter model di panel filter, tentukan hal berikut:
- Tugas: Klik tugas yang Anda inginkan untuk dijalankan model.
- Koleksi model: Klik untuk memilih model yang dikelola oleh Google, partner, atau Anda.
- Providers: Klik penyedia model.
- Fitur: Klik fitur yang Anda inginkan dalam model.
Untuk mempelajari lebih lanjut setiap model, klik kartu modelnya.
Pemindaian keamanan model
Google melakukan pengujian dan benchmarking menyeluruh pada container penayangan dan penyesuaian yang kami sediakan. Pemindaian kerentanan aktif juga diterapkan ke artefak container.
Model pihak ketiga dari partner unggulan menjalani pemindaian checkpoint model untuk memastikan keasliannya. Model pihak ketiga dari HuggingFace Hub dipindai langsung oleh HuggingFace dan pemindai pihak ketiga mereka untuk mencari malware, file pickle, lapisan Keras Lambda, dan secret. Model yang dianggap tidak aman dari pemindaian ini ditandai oleh HuggingFace dan diblokir dari deployment di Model Garden. Model yang dianggap mencurigakan atau yang memiliki kemampuan untuk berpotensi menjalankan kode jarak jauh ditunjukkan di Model Garden, tetapi masih dapat di-deploy. Sebaiknya lakukan peninjauan menyeluruh terhadap model yang mencurigakan sebelum men-deploy-nya dalam Model Garden.
Harga
Untuk model open source di Model Garden, Anda akan dikenai biaya untuk penggunaan hal berikut di Gemini Enterprise Agent Platform:
- Penyesuaian model: Anda akan dikenai biaya untuk resource komputasi yang digunakan dengan tarif yang sama seperti pelatihan kustom. Lihat harga pelatihan kustom.
- Deployment model: Anda akan dikenai biaya untuk resource komputasi yang digunakan untuk men-deploy model ke endpoint. Lihat harga prediksi.
- Colab Enterprise: Lihat harga Colab Enterprise.
Mengontrol akses ke model tertentu
Anda dapat menetapkan kebijakan organisasi Model Garden di tingkat organisasi, folder, atau project untuk mengontrol akses ke model tertentu di Model Garden. Misalnya, Anda dapat mengizinkan akses ke model tertentu yang telah Anda periksa dan menolak akses ke semua model lainnya.
Mempelajari lebih lanjut Model Garden
Untuk mengetahui informasi selengkapnya tentang opsi deployment dan penyesuaian yang dapat Anda lakukan dengan model di Model Garden, lihat referensi di bagian berikut, yang mencakup link ke tutorial, referensi, notebook, dan video YouTube.
Men-deploy dan menayangkan
Pelajari lebih lanjut cara menyesuaikan deployment dan fitur penayangan lanjutan.
- Men-deploy dan menayangkan model open source menggunakan Python SDK, CLI, REST API, atau konsol
- Men-deploy dan menyesuaikan Gemma 3 di video YouTube Model Garden
- Men-deploy Gemma dan membuat prediksi
- Menayangkan model terbuka dengan container Hex-LLM di Cloud TPU
- Men-deploy model Llama menggunakan notebook tutorial Hex-LLM
- Menggunakan cache awalan dan decoding spekulatif dengan notebook tutorial Hex-LLM atau vLLM
- Menggunakan vLLM untuk menayangkan model bahasa multimodel dan khusus teks di GPU Cloud
- Menggunakan container penayangan GPU xDiT untuk pembuatan gambar dan video
- Menayangkan Gemma 2 dengan beberapa adaptor LoRA menggunakan HuggingFace DLC untuk tutorial inferensi PyTorch di Medium
- Menggunakan handle kustom untuk menayangkan PaliGemma untuk pemberian teks pada gambar dengan HuggingFace DLC untuk tutorial inferensi PyTorch di LinkedIn
- Men-deploy dan menayangkan model yang menggunakan notebook tutorial reservasi Compute Engine atau VM Spot
- Men-deploy dan menayangkan model HuggingFace
Penyesuaian
Pelajari lebih lanjut cara menyesuaikan model untuk menyesuaikan respons untuk kasus penggunaan tertentu.
- Notebook tutorial penyesuaian Workbench
- Notebook tutorial penyesuaian dan evaluasi
- Men-deploy dan menyesuaikan Gemma 3 di video YouTube Model Garden
Evaluasi
Pelajari lebih lanjut cara menilai respons model dengan Platform Agen
Referensi lainnya
- Notebook Model Garden khusus model dan perjalanan pengguna
- Notebook penayangan, penyesuaian, dan evaluasi model terbuka Platform Agen Gemini Enterprise