Halaman ini menjelaskan cara mengelola agen yang telah di-deploy ke runtime terkelola Vertex AI Agent Engine. Agen yang di-deploy adalah resource berjenis reasoningEngine di Vertex AI.
Mencantumkan agen yang di-deploy
Mencantumkan semua agen yang di-deploy untuk project dan lokasi tertentu:
Konsol
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Agen yang di-deploy yang merupakan bagian dari project yang dipilih akan muncul dalam daftar. Anda dapat menggunakan kolom Filter untuk memfilter daftar menurut kolom yang Anda tentukan.
Vertex AI SDK untuk Python
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
for agent in client.agent_engines.list():
print(agent)
Untuk memfilter daftar menurut display_name:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
REST
Panggil metode reasoningEngines.list.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID: project ID GCP AndaLOCATION: wilayah yang didukung
Metode HTTP dan URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mode ekspres Vertex AI
Anda dapat menggunakan Vertex AI SDK untuk Python atau REST dengan mode ekspres Vertex AI. Untuk mengetahui informasi selengkapnya tentang mode ekspres Vertex AI dan petunjuk cara mendaftar, lihat Ringkasan Vertex AI dalam mode ekspres.
Vertex AI SDK
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
for agent in client.agent_engines.list():
print(agent)
Ganti API_KEY dengan kunci API mode ekspres Anda
Untuk memfilter daftar menurut display_name:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
REST API
Perintah REST berikut memanggil metode reasoningEngines.list:
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
API_KEY: kunci API mode ekspres Anda
Metode HTTP dan URL:
GET https://aiplatform.googleapis.com/v1/projects/reasoningEngines?key=API_KEY
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mendapatkan agen yang di-deploy
Setiap agen yang di-deploy memiliki ID RESOURCE_ID yang unik.
Untuk mempelajari lebih lanjut, lihat Men-deploy agen.
Konsol
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Agen yang di-deploy yang merupakan bagian dari project yang dipilih akan muncul dalam daftar. Anda dapat menggunakan kolom Filter untuk memfilter daftar menurut kolom yang Anda tentukan.
Klik nama agen yang ditentukan. Halaman Metrics untuk agen akan terbuka.
(Opsional) Untuk melihat detail deployment agen, klik Detail deployment. Panel Deployment details akan terbuka. Untuk menutup panel, klik Selesai.
(Opsional) Untuk melihat URL
querydanstreamQueryuntuk agen, klik URL API. Panel URL API akan terbuka. Untuk menutup panel, klik Selesai.
Vertex AI SDK untuk Python
Kode berikut memungkinkan Anda mendapatkan agen yang di-deploy tertentu:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
remote_agent = client.agent_engines.get(
name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Panggil metode reasoningEngines.get.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID: project ID GCP AndaLOCATION: wilayah yang didukungRESOURCE_ID: ID resource agen yang di-deploy
Metode HTTP dan URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mode ekspres Vertex AI
Anda dapat menggunakan Vertex AI SDK untuk Python atau REST dengan mode ekspres Vertex AI. Untuk mengetahui informasi selengkapnya tentang mode ekspres Vertex AI dan petunjuk cara mendaftar, lihat Ringkasan Vertex AI dalam mode ekspres.
Vertex AI SDK
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
remote_agent = client.agent_engines.get(
name="RESOURCE_NAME"
)
# Resource Name: "projects/{PROJECT_NUMBER}/locations/{LOCATION}/reasoningEngines/{RESOURCE_ID}"
# RESOURCE_ID can be used for the REST commands
Ganti API_KEY dengan kunci API mode ekspres Anda
REST API
Perintah REST berikut memanggil metode reasoningEngines.get:
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
RESOURCE_ID: ID resource agen yang di-deployAPI_KEY: kunci API mode ekspres Anda
Metode HTTP dan URL:
GET https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?key=API_KEY
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Memperbarui agen yang di-deploy
Anda dapat memperbarui satu atau beberapa kolom agen yang di-deploy secara bersamaan, tetapi Anda harus menentukan setidaknya satu kolom yang akan diperbarui. Waktu yang diperlukan untuk memperbarui agen yang di-deploy bergantung pada update yang dilakukan, tetapi biasanya memerlukan waktu antara beberapa detik hingga beberapa menit.
Konsol
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Untuk agen yang Anda tentukan, klik menu tindakan lainnya ().
Klik Edit. Panel Edit untuk agen akan terbuka.
Edit Nama tampilan atau Deskripsi untuk agen.
Klik Simpan.
Vertex AI SDK untuk Python
Untuk mengupdate agen yang di-deploy (sesuai dengan RESOURCE_NAME)
ke agen yang diupdate (sesuai dengan UPDATED_AGENT):
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Argumennya sama seperti saat Anda men-deploy agen.
REST
Panggil metode reasoningEngines.patch dan berikan update_mask untuk menentukan kolom yang akan diperbarui.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID: project ID GCP AndaLOCATION: wilayah yang didukungRESOURCE_ID: ID resource agen yang di-deployupdate_mask: daftar kolom yang dipisahkan koma yang akan diupdate
Metode HTTP dan URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"
Meminta isi JSON:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mode ekspres Vertex AI
Anda dapat menggunakan Vertex AI SDK untuk Python atau REST dengan mode ekspres Vertex AI. Untuk mengetahui informasi selengkapnya tentang mode ekspres Vertex AI dan petunjuk cara mendaftar, lihat Ringkasan Vertex AI dalam mode ekspres.
Vertex AI SDK
Kode berikut menggunakan Vertex AI SDK untuk Python guna memperbarui agen yang di-deploy (sesuai dengan RESOURCE_NAME)
ke agen yang diperbarui (sesuai dengan UPDATED_AGENT):
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Ganti API_KEY dengan kunci API mode ekspres Anda
REST API
Perintah REST berikut memanggil metode reasoningEngines.patch dan menyediakan update_mask untuk menentukan kolom yang akan diperbarui:
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
RESOURCE_ID: ID resource agen yang di-deployAPI_KEY: kunci API mode ekspres Andaupdate_mask: daftar kolom yang dipisahkan koma yang akan diupdate
Metode HTTP dan URL:
PATCH https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"&key=API_KEY
Meminta isi JSON:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mengonfigurasi telemetri untuk agen yang di-deploy
Jika Anda mengaktifkan rekaman aktivitas selama pengembangan agen, Anda dapat menggunakan konsol Google Cloud untuk mengonfigurasi telemetri untuk agen yang di-deploy.
Konfigurasi telemetri untuk agen yang di-deploy dengan telemetri yang diaktifkan:
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Instance Agent Engine yang merupakan bagian dari project yang dipilih akan muncul dalam daftar. Anda dapat menggunakan kolom Filter untuk memfilter daftar menurut kolom yang Anda tentukan.
Temukan baris untuk instance Agent Engine Anda. Di kolom Konfigurasi telemetri, klik Konfigurasi. Panel Konfigurasi layanan akan terbuka.
Anda dapat melakukan konfigurasi berikut:
Observabilitas: Anda dapat mengonfigurasi hal berikut:
Aktifkan instrumentasi log dan rekaman aktivitas OpenTelemetry: Untuk mengisi dasbor keobservasian dan halaman rekaman aktivitas agen, klik tombol ke posisi aktif.
Aktifkan logging input perintah dan output respons: Untuk mengumpulkan dan menyimpan konten lengkap perintah dan respons pengguna, klik tombol untuk mengaktifkannya.
Jika pengumpulan telemetri dinonaktifkan untuk agen, Anda harus men-deploy ulang agen dan memperbarui versi Vertex AI SDK ke
>= 1.126.1agar dapat melihat opsi konfigurasi untuk Observability.Container: Mengonfigurasi setelan container untuk agen yang di-deploy:
Penskalaan: Masukkan Jumlah minimum instance dan Jumlah maksimum instance.
Resource: Pilih batas untuk Memori dan CPU untuk setiap container.
Serentak container: Masukkan Jumlah minimum instance untuk menetapkan serentak untuk setiap server agen dan container. Nilai yang direkomendasikan adalah (2 * CPU + 1), dan nilai defaultnya adalah 9.
Akses dan Izin: Klik Kelola Izin di IAM untuk mengelola izin agen di akun layanan terkait.
Detail deployment: Lihat detail deployment untuk agen, termasuk Nama resource dan Nama tampilan.
Bank Memori: Lihat detail Bank Memori untuk agen, termasuk Pembuatan Memori dan Penelusuran Memori.
Klik Perbarui atau Tutup.
Melihat metrik untuk agen yang di-deploy
Untuk agen yang di-deploy, Anda dapat menggunakan konsol untuk melihat metrik agen:
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Agen yang di-deploy yang merupakan bagian dari project yang dipilih akan muncul dalam daftar. Anda dapat menggunakan kolom Filter untuk memfilter daftar menurut kolom yang Anda tentukan.
Klik nama agen Anda. Dasbor akan ditampilkan untuk agen yang Anda pilih.
Pilih salah satu tab Dasbor berikut:
Ringkasan: Lihat dasbor ringkasan metrik untuk agen Anda, termasuk latensi agen, jumlah permintaan agen, dan rasio error agen.
Model: Lihat dasbor metrik untuk model agen Anda, termasuk jumlah panggilan model, rasio error model, dan penggunaan token model.
Alat: Lihat dasbor metrik untuk alat agen Anda, termasuk jumlah panggilan alat, rasio error alat, dan latensi alat.
Penggunaan: Lihat dasbor metrik untuk penggunaan agen Anda, termasuk penggunaan token menurut input dan output, alokasi CPU container, dan alokasi memori container.
Log: Lihat log agen Anda, jika Anda mengaktifkan Cloud Logging untuk agen Anda.

Menghapus agen yang di-deploy
Menghapus agen yang di-deploy dari runtime terkelola Vertex AI Agent Engine.
Konsol
- Di konsol Google Cloud , buka halaman Vertex AI Agent Engine.
Untuk agen yang Anda tentukan, klik menu tindakan lainnya ().
Klik Hapus.
Klik Hapus agen.
Vertex AI SDK untuk Python
Jika sudah memiliki instance agen yang di-deploy
(sebagai remote_agent), Anda dapat menjalankan perintah berikut:
remote_agent.delete(
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
Atau, Anda dapat memanggil agent_engines.delete() untuk menghapus agen
yang di-deploy yang sesuai dengan RESOURCE_NAME dengan cara berikut:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
REST
Panggil metode reasoningEngines.delete.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID: project ID GCP AndaLOCATION: wilayah yang didukungRESOURCE_ID: ID resource agen yang di-deploy
Metode HTTP dan URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status berhasil (2xx) dan respons kosong.
Mode ekspres Vertex AI
Anda dapat menggunakan Vertex AI SDK untuk Python atau REST dengan mode ekspres Vertex AI.
Vertex AI SDK
Kode berikut menggunakan Vertex AI SDK untuk Python guna menghapus agen yang di-deploy
yang sesuai dengan RESOURCE_NAME dengan cara berikut:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
Ganti API_KEY dengan kunci API mode ekspres Anda
REST API
Perintah REST berikut memanggil metode reasoningEngines.delete:
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
RESOURCE_ID: ID resource agen yang di-deployAPI_KEY: kunci API mode ekspres Anda
Metode HTTP dan URL:
DELETE https://aiplatform.googleapis.com/v1/projects/reasoningEngines/RESOURCE_ID?key=API_KEY
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima kode status yang berhasil (2xx) dan respons kosong.