Halaman ini menjelaskan cara men-grounding respons menggunakan data Anda dari Agent Search.
Men-grounding Gemini ke data Anda
Jika Anda ingin melakukan retrieval-augmented generation (RAG), hubungkan model Anda ke data situs atau kumpulan dokumen Anda, lalu gunakan Grounding dengan Agent Search.
Grounding ke data Anda mendukung maksimal 10 sumber data Agent Search dan dapat digabungkan dengan Grounding dengan Google Penelusuran.
Model yang didukung
Bagian ini mencantumkan model yang mendukung grounding dengan data Anda.
Prasyarat
Sebelum Anda dapat men-grounding output model ke data Anda, lakukan hal berikut:
Di Google Cloud konsol, buka halaman IAM, lalu telusuri izin
discoveryengine.servingConfigs.search, yang diperlukan agar layanan grounding berfungsi.Untuk mendapatkan izin yang diperlukan untuk menggunakan grounding dengan Agent Search, minta administrator untuk memberi Anda peran IAM berikut:
Untuk membaca semua resource Discovery Engine: Discovery Engine Viewer (
roles/discoveryengine.viewer).Untuk membaca dan menulis semua resource Discovery Engine serta membuat instance Agent Search: Discovery Engine Editor (
roles/discoveryengine.editor).
Untuk mengetahui informasi selengkapnya tentang IAM, lihat Peran IAM dan izin.
Aktifkan AI Applications dan API-nya.
Buat sumber data AI Applications dan aplikasi.
Untuk mengetahui informasi selengkapnya, lihat Pengantar Agent Search.
Mengaktifkan AI Applications
Untuk menggunakan Agent Search guna men-grounding respons Anda, Anda harus mengaktifkan layanan Agent Search dengan mengikuti langkah-langkah berikut:
Di Google Cloud konsol, buka halaman AI Applications.
Opsional: Tinjau persyaratan penggunaan data.
AI Applications tersedia di lokasi global atau multi-region eu dan us. Untuk mempelajari lebih lanjut, lihat Lokasi AI Applications.
Membuat penyimpanan data di AI Applications
Untuk membuat penyimpanan data di AI Applications, Anda dapat memilih untuk men-grounding dengan data situs atau dokumen.
Situs
Buka halaman Create Data Store dari Google Cloud konsol.
Di kotak Website Content, klik Select.
Panel Specify the websites for your data store akan ditampilkan.Jika Advanced website indexing tidak dicentang, centang kotak Advanced website indexing untuk mengaktifkannya.
Configure your data store panel akan ditampilkan.Di bagian Specify URL patterns to index, lakukan hal berikut:
- Tambahkan URL untuk Sites to include.
- Opsional: Tambahkan URL untuk Sites to exclude.
Klik Continue.
Di panel Configure your data store,
- Pilih nilai dari daftar Location of your data store.
- Masukkan nama di kolom Your data store name. ID akan dibuat. Gunakan ID ini saat Anda membuat respons yang relevan dengan penyimpanan data Anda. Untuk mengetahui informasi selengkapnya, lihat Membuat respons yang relevan dengan penyimpanan data Anda.
- Klik Create.
Dokumen
Buka halaman Create Data Store dari Google Cloud konsol.
Di kotak Cloud Storage, klik Select.
Panel Import data from Cloud Storage akan ditampilkan.Di bagian Unstructured documents (PDF, HTML, TXT and more), pilih Unstructured documents (PDF, HTML, TXT and more).
Pilih opsi Synchronization frequency.
Pilih opsi Select a folder or a file you want to import, lalu masukkan jalur di kolom.
Klik Continue.
Panel Configure your data store akan ditampilkan.Di panel Configure your data store,
- Pilih nilai dari daftar Location of your data store.
- Masukkan nama di kolom Your data store name. ID akan dibuat.
- Untuk memilih opsi penguraian dan pengelompokan untuk dokumen Anda, luaskan bagian Document Processing Options. Untuk mengetahui informasi selengkapnya tentang pengurai yang berbeda, lihat Mengurai dokumen.
- Klik Create.
Klik Create.
Membuat respons yang relevan dengan penyimpanan data Anda
Gunakan petunjuk berikut untuk men-grounding model dengan data Anda. Maksimal 10 penyimpanan data didukung.
Jika Anda tidak mengetahui ID penyimpanan data, ikuti langkah-langkah berikut:
Di Google Cloud konsol, buka halaman AI Applications , lalu di menu navigasi, klik Data stores.
Klik nama penyimpanan data Anda.
Di halaman Data untuk penyimpanan data Anda, dapatkan ID penyimpanan data.
Konsol
Untuk men-grounding output model Anda ke AI Applications menggunakan Gemini Enterprise Agent Platform Studio di Google Cloud konsol, ikuti langkah-langkah berikut:
- Di Google Cloud konsol, buka halaman Gemini Enterprise Agent Platform Studio.
- Untuk mengaktifkan grounding, ikuti langkah-langkah berikut:
- Klik + New dan Chat dari menu navigasi.
- Luaskan panel Model settings, lalu pilih model Anda.
- Opsional: Jika tombol Structured output atau Grounding: Google aktif, nonaktifkan opsi tersebut.
- Klik tombol Grounding: Your data. Panel Customize Grounding akan muncul.
- Pilih opsi sumber grounding dari tabel berikut:
- Masukkan nilai ke kolom Elasticsearch endpoint.
- Masukkan nilai ke kolom Elasticsearch API Key.
- Masukkan nilai ke kolom Elasticsearch index.
- Masukkan nilai ke kolom Elasticsearch search template.
- Klik Save.
Opsi grounding Deskripsi Input Mesin RAG Vertex AI Grounding menggunakan data Anda dan komponen buatan sendiri. Jika Anda tidak memiliki korpus, Anda harus membuatnya. Jika tidak, masukkan korpus Anda. Agent Search Grounding menggunakan data Anda dengan mesin telusur terkelola. Google Masukkan jalur Anda ke kolom Gemini Enterprise Agent Platform datastore path. Elasticsearch Grounding menggunakan Elasticsearch. Masukkan informasi berikut:
- Masukkan perintah Anda di kotak teks, lalu klik Submit. Respons perintah Anda didasarkan pada AI Applications.
Python
Instal
pip install --upgrade google-genai
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
from google import genai
from google.genai.types import (
GenerateContentConfig,
VertexAISearch,
Retrieval,
Tool,
HttpOptions,
)
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Replace with your Agent Search data store details
DATASTORE_PATH = "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID"
tool = Tool(
retrieval=Retrieval(
vertex_ai_search=VertexAISearch(
datastore=DATASTORE_PATH
)
)
)
response = client.models.generate_content(
model="gemini-2.5-flash", # Or another supported model
contents="What information can you find about topic X in the provided documents?", # Your query
config=GenerateContentConfig(
tools=[tool],
),
)
print(response.text)
REST
Untuk menguji perintah teks menggunakan Agent Platform API, kirim permintaan POST ke endpoint model penayang.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- LOCATION: Region untuk memproses permintaan.
Untuk menggunakan
globalendpoint, kecualikan lokasi dari nama endpoint, dan konfigurasi lokasi resource keglobal. - PROJECT_ID: [Project ID](/resource-manager/docs/creating-managing-projects#identifiers) Anda. .
- MODEL_ID: ID model multimodal.
- PROMPT: Perintah yang akan dikirim ke model.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Meminta isi JSON:
{
"contents": [{
"role": "user",
"parts": [{
"text": "PROMPT"
}]
}],
"tools": [{
"retrieval": {
"vertexAiSearch": {
"datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan melihat respons JSON seperti berikut:
{
"candidates": [
{
"content": {
"role": "model",
"parts": [
{
"text": "You can make an appointment on the website https://dmv.gov/"
}
]
},
"finishReason": "STOP",
"safetyRatings": [
"..."
],
"groundingMetadata": {
"retrievalQueries": [
"How to make appointment to renew driving license?"
],
"groundingChunks": [
{
"retrievedContext": {
"uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
"title": "dmv"
}
}
],
"groundingSupport": [
{
"segment": {
"startIndex": 25,
"endIndex": 147
},
"segment_text": "ipsum lorem ...",
"supportChunkIndices": [1, 2],
"confidenceScore": [0.9541752, 0.97726375]
},
{
"segment": {
"startIndex": 294,
"endIndex": 439
},
"segment_text": "ipsum lorem ...",
"supportChunkIndices": [1],
"confidenceScore": [0.9541752, 0.9325467]
}
]
}
}
],
"usageMetadata": {
"..."
}
}
Memahami respons Anda
Respons dari kedua API tersebut mencakup teks yang dihasilkan LLM, yang disebut kandidat. Jika perintah model Anda berhasil didasarkan pada sumber data Anda, respons akan menyertakan metadata grounding, yang mengidentifikasi bagian respons yang berasal dari data Anda. Namun, ada beberapa alasan mengapa metadata ini mungkin tidak diberikan, dan respons perintah tidak akan didasarkan. Alasan ini mencakup relevansi sumber yang rendah atau informasi yang tidak lengkap dalam respons model.
Berikut adalah rincian data output:
- Role: Menunjukkan pengirim jawaban yang relevan. Karena respons selalu berisi teks yang relevan, peran selalu
model. - Teks: Jawaban yang relevan yang dihasilkan oleh LLM.
- Metadata grounding: Informasi tentang sumber grounding, yang berisi
elemen berikut:
- Grounding chunks: Daftar hasil dari indeks Anda yang mendukung jawaban.
- Dukungan dasar: Informasi tentang klaim tertentu dalam jawaban yang dapat digunakan untuk menampilkan kutipan:
- Segmen: Bagian jawaban model yang dibuktikan oleh potongan grounding.
- Grounding chunk index: Indeks potongan grounding dalam daftar potongan grounding yang sesuai dengan klaim ini.
- Skor kepercayaan: Angka dari 0 hingga 1 yang menunjukkan seberapa relevan klaim tersebut dalam kumpulan potongan grounding yang diberikan. Tidak tersedia untuk Gemini 2.5 dan yang lebih baru.
Langkah berikutnya
- Untuk mempelajari cara mengirim permintaan perintah chat, lihat Chat multiturn.
- Untuk mempelajari praktik terbaik AI yang bertanggung jawab dan filter keamanan Agent Platform, lihat Praktik terbaik keamanan.