Gemini Enterprise Agent Platform menyediakan berbagai cara untuk mengelola throughput model AI generatif guna membantu Anda menyeimbangkan biaya dan performa. Dokumen ini menjelaskan opsi yang tersedia: model bayar sesuai penggunaan yang fleksibel dan kapasitas yang dipesan untuk throughput yang dapat diprediksi.
Kuota model terkelola
Agent Platform menawarkan dua cara untuk mengelola throughput bagi model AI generatif terkelola di Gemini Enterprise Agent Platform, yang memungkinkan Anda menyeimbangkan biaya, fleksibilitas, dan performa. Anda dapat menggunakan model bayar sesuai penggunaan atau mencadangkan jumlah throughput khusus dengan harga tetap.
Bayar sesuai penggunaan
Untuk model bayar sesuai penggunaan default, Agent Platform menggunakan Bayar sesuai penggunaan standar (Standard PayGo). PayGo memungkinkan Anda hanya membayar resource yang Anda gunakan, tanpa memerlukan komitmen keuangan di awal. Ada opsi PayGo tambahan yang bervariasi dalam biaya dan performa. Untuk mengetahui informasi selengkapnya, lihat Priority PayGo atau Flex PayGo.
Kapasitas yang Dicadangkan
Untuk aplikasi produksi penting yang memerlukan performa yang konsisten dan biaya yang dapat diprediksi, Anda dapat menggunakan Throughput yang Disediakan. Throughput yang Disediakan adalah langganan biaya tetap yang mencadangkan jumlah throughput tertentu untuk model Anda di lokasi yang dipilih.
Kouta untuk layanan AI Generatif
Platform Agen Gemini Enterprise menawarkan serangkaian layanan AI generatif, seperti penyesuaian model, evaluasi model, prediksi batch, penyematan, dan Retrieval-Augmented Generation. Untuk mempelajari lebih lanjut kuota untuk layanan ini, lihat Kuota dan batas sistem AI Generatif di Platform Agen Gemini Enterprise.
Langkah berikutnya
- Pelajari lebih lanjut Standard PayGo.
- Pelajari lebih lanjut Throughput yang Disediakan.
- Pelajari lebih lanjut kuota AI generatif dan batas sistem.
- Pelajari lebih lanjut kuota Google Cloud.