Google utilizza la tecnologia AI per tradurre i contenuti nella tua lingua preferita. Le traduzioni generate dall'AI potrebbero contenere errori.

Utilizzare Pinecone con RAG Engine

Questa pagina mostra come collegare il corpus RAG al tuo Pinecone Pinecone.

Puoi anche seguire le istruzioni utilizzando questo notebook RAG Engine with Pinecone.

Puoi utilizzare l'istanza del database Pinecone con RAG Engine per indicizzare ed eseguire una ricerca di similarità basata su vettori. Una ricerca di similarità è un modo per trovare parti di testo che sono simili al testo che stai cercando, che richiede l'utilizzo di un modello di incorporamento. Il modello di incorporamento produce dati vettoriali per ogni parte di testo da confrontare. La ricerca di similarità viene utilizzata per recuperare i contesti semantici per grounding in modo da restituire i contenuti più accurati dall'LLM.

Con RAG Engine, puoi continuare a utilizzare l'istanza del database vettoriale completamente gestita, di cui sei responsabile del provisioning. RAG Engine utilizza il database vettoriale per l'archiviazione, la gestione degli indici e la ricerca.

Valuta se utilizzare Pinecone con RAG Engine

Valuta se l'utilizzo del database Pinecone è la scelta migliore per la tua applicazione RAG esaminando quanto segue:

Devi creare, configurare e gestire lo scaling dell'istanza del database Pinecone.
RAG Engine utilizza lo spazio dei nomi predefinito nell'indice. Assicurati che questo spazio dei nomi non sia modificabile da altri elementi.
Devi fornire una chiave API Pinecone, che consente a RAG Engine di interagire con il database Pinecone. RAG Engine non archivia e non gestisce la chiave API Pinecone. Devi invece eseguire le seguenti operazioni:
- Archivia la chiave in Google Cloud Secret Manager.
- Concedi al account di servizio del tuo progetto le autorizzazioni per accedere al secret.
- Fornisci a RAG Engine l'accesso al nome della risorsa del secret.
- Quando interagisci con il corpus RAG, RAG Engine accede alla risorsa secret utilizzando il tuo account di servizio.
- Il corpus RAG e l'indice Pinecone hanno una mappatura uno a uno. Questa associazione viene eseguita nell'ambito del ragCorpora.create metodo o del ragCorpora.patch metodo.

Crea l'indice Pinecone

Per creare l'indice Pinecone, devi seguire questi passaggi:

Consulta la guida rapida di Pinecone per ottenere le configurazioni dell'indice che devono essere specificate nell'indice per renderlo compatibile con il corpus RAG.
Per i seguenti motivi, devi assicurarti che la località dell'indice Pinecone sia la stessa o vicina a quella in cui utilizzi RAG Engine:
- Vuoi mantenere una latenza ridotta.
- Vuoi soddisfare i requisiti di residenza dei dati stabiliti dalle leggi vigenti.
Durante la creazione dell'indice Pinecone, specifica la dimensione dell'incorporamento da utilizzare con RAG Engine. Questa tabella fornisce le dimensioni o la posizione delle dimensioni:

Modello Dimensione

Gecko proprietario 768

Gecko proprietario con ottimizzazione 768

E5 Consulta Utilizzare i modelli di incorporamento OSS.
Scegli una delle seguenti metriche di distanza supportate:
- cosine
- dotproduct
- euclidean
(Facoltativo) Quando crei un indice basato su pod, devi specificare file_id nel campo pod.metadata_config.indexed. Per maggiori informazioni, consulta Indicizzazione selettiva dei metadati.

Modello	Dimensione
Gecko proprietario	768
Gecko proprietario con ottimizzazione	768
E5	Consulta Utilizzare i modelli di incorporamento OSS.

Crea la chiave API Pinecone

RAG Engine può connettersi all'indice Pinecone solo utilizzando la chiave API per l'autenticazione e l'autorizzazione. Devi seguire la guida ufficiale di Pinecone per l'autenticazione per configurare l'autenticazione basata su chiave API nel tuo progetto Pinecone.

Archivia la chiave API in Secret Manager

Una chiave API contiene informazioni sensibili che consentono l'identificazione personale (SPII), soggette a requisiti legali. Se i dati SPII vengono compromessi o utilizzati in modo improprio, una persona potrebbe subire un rischio o un danno significativo. Per ridurre al minimo i rischi per una persona durante l'utilizzo di RAG Engine, non archiviare e non gestire la chiave API ed evita di condividerla non criptata.

Per proteggere le SPII, devi eseguire le seguenti operazioni:

Archivia la chiave API in Secret Manager.
Concedi al account di servizio RAG Engine le autorizzazioni per i tuoi secret e gestisci il controllo dell'accesso a livello di risorsa secret.
1. Vai alle autorizzazioni del tuo progetto.
2. Attiva l'opzione Includi concessioni di ruoli fornite da Google.
3. Trova il account di servizio, che ha il seguente formato:
  
  service-{project number}@gcp-sa-vertex-rag.iam.gserviceaccount.com
4. Modifica le entità del account di servizio.
5. Aggiungi il ruolo Secret Manager Secret Accessor al service account.
Durante la creazione o l'aggiornamento del corpus RAG, passa il nome della risorsa secret a RAG Engine e archivialo.

Quando effettua richieste API ai tuoi indici Pinecone, RAG Engine utilizza ogni account di servizio per leggere la chiave API corrispondente alle tue risorse secret in Secret Manager dai tuoi progetti.

Provisioning del account di servizio RAG Engine

Quando crei il primo corpus RAG nel tuo progetto, RAG Engine crea un account di servizio dedicato. Puoi trovare il tuo account di servizio nella pagina Identity and Access Management del tuo progetto.

Il account di servizio segue questo formato fisso:

service-{project number}@gcp-sa-vertex-rag.iam.gserviceaccount.com

Ad esempio,

service-123456789@gcp-sa-vertex-rag.iam.gserviceaccount.com

Prepara il corpus RAG

Per utilizzare l'indice Pinecone con RAG Engine, devi associarlo a un corpus RAG durante la fase di creazione. Una volta eseguita l'associazione, questo binding è permanente per tutta la durata del corpus RAG. L'associazione può essere eseguita utilizzando l'API CreateRagCorpus o UpdateRagCorpus.

Affinché l'associazione sia considerata completa, devi impostare tre campi chiave nel corpus RAG:

rag_vector_db_config.pinecone: questo campo ti consente di impostare la scelta di un database vettoriale che vuoi associare al tuo corpus RAG e deve essere impostato durante la chiamata API CreateRagCorpus. Se non è impostato, al corpus RAG viene assegnata la scelta predefinita del database vettoriale RagManagedDb.
rag_vector_db_config.pinecone.index_name: questo è il nome utilizzato per creare l'indice Pinecone utilizzato con il corpus RAG. Puoi impostare il nome durante la chiamata CreateRagCorpus oppure puoi specificarlo quando chiami l'API UpdateRagCorpus.
rag_vector_db_config.api_auth.api_key_config.api_key_secret_version: questo è il nome completo della risorsa del secret archiviato in Secret Manager, che contiene la chiave API Pinecone. Puoi impostare il nome durante la chiamata CreateRagCorpus oppure puoi specificarlo quando chiami l'API UpdateRagCorpus. Finché non specifichi questo campo, non puoi importare dati nel corpus RAG.

Questo campo deve avere il seguente formato:

projects/{PROJECT_NUMBER}/secrets/{SECRET_ID}/versions/{VERSION_ID}

Crea il corpus RAG

Se hai accesso al nome dell'indice Pinecone e al nome della risorsa secret con le autorizzazioni impostate, puoi creare il corpus RAG e associarlo all'indice Pinecone, come illustrato in questo codice campione.

La prima volta che crei un corpus RAG, non avrai a disposizione le informazioni del service account. Tuttavia, i campi sono facoltativi e possono essere associati al corpus RAG utilizzando l'API UpdateRagCorpus.

Per un esempio di come creare il corpus RAG senza fornire le informazioni del service account, consulta Creare un corpus RAG senza un nome di indice o una chiave API.

Python

Prima di provare questo esempio, segui le istruzioni di configurazione Python nella guida rapida di Agent Platform per l'utilizzo delle librerie client.

Per eseguire l'autenticazione in Agent Platform, configura le credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.


import agentplatform
from agentplatform import types

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# pinecone_index_name = "pinecone-index-name"
# display_name = "test_corpus"
# description = "Corpus Description"

# Initialize Agent Platform client once per session
client = agentplatform.Client(project=PROJECT_ID, location="us-central1")

# Configure embedding model (Optional)
embedding_model_config = types.RagEmbeddingModelConfig(
    vertex_prediction_endpoint=types.RagEmbeddingModelConfigVertexPredictionEndpoint(
        endpoint="publishers/google/models/text-embedding-005"
    )
)

# Configure Vector DB
vector_db = types.RagVectorDbConfig(
    pinecone=types.RagVectorDbConfigPinecone(
     index_name=pinecone_index_name,
    ),
    rag_embedding_model_config=embedding_model_config,
)

corpus = client.rag.create_corpus(
    rag_corpus=types.RagCorpus(
        display_name=display_name,
        description=description,
        rag_vector_db_config=vector_db,
    )
)
print(corpus)
# Example response:
# RagCorpus(name='projects/1234567890/locations/us-central1/ragCorpora/1234567890',
# display_name='test_corpus', description='Corpus Description', embedding_model_config=...
# ...

REST

   # Set your project ID under which you want to create the corpus
   PROJECT_ID = "YOUR_PROJECT_ID"

   # Choose a display name for your corpus
   CORPUS_DISPLAY_NAME=YOUR_CORPUS_DISPLAY_NAME

   # Set your Pinecone index name
   PINECONE_INDEX_NAME=YOUR_INDEX_NAME

   # Set the full resource name of your secret. Follows the format
   # projects/{PROJECT_NUMER}/secrets/{SECRET_ID}/versions/{VERSION_ID}
   SECRET_RESOURCE_NAME=YOUR_SECRET_RESOURCE_NAME

   # Call CreateRagCorpus API with all the Vector DB information.
   # You can also add the embedding model choice or set other RAG corpus parameters on
   # this call per your choice.
   curl -X POST \
   -H "Authorization: Bearer $(gcloud auth print-access-token)" \
   -H "Content-Type: application/json" \
   https://us-central1-aiplatform.googleapis.com}/v1beta1/projects/${PROJECT_ID}/locations/us-central1/ragCorpora -d '{
         "display_name" : '\""${CORPUS_DISPLAY_NAME}"\"',
         "rag_vector_db_config" : {
            "pinecone": {"index_name": '\""${PINECONE_INDEX_NAME}"\"'},
            "api_auth": {"api_key_config":
                  {"api_key_secret_version": '\""${SECRET_RESOURCE_NAME}"\"'}
            }
         }
      }'

   # To poll the status of your RAG corpus creation, get the operation_id returned in
   # response of your CreateRagCorpus call.
   OPERATION_ID="YOUR_OPERATION_ID"

   # Poll Operation status until done = true in the response.
   # The response to this call will contain the ID for your created RAG corpus
   curl -X GET \
   -H "Authorization: Bearer $(gcloud auth print-access-token)" \
   -H "Content-Type: application/json" \
   https://us-central1-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/us-central1/operations/${OPERATION_ID}

Crea un corpus RAG senza un nome di indice o una chiave API

Se questo è il tuo primo corpus RAG e non hai accesso ai dettagli del tuo service account o non hai completato i passaggi di provisioning per l'indice Pinecone, puoi comunque creare il corpus RAG. Puoi quindi associare il corpus RAG a una configurazione Pinecone vuota e aggiungere i dettagli in un secondo momento.

Devi tenere presente quanto segue:

Se non fornisci il nome dell'indice e il nome del secret della chiave API, non è possibile importare i file nel corpus RAG.
Se scegli Pinecone come database vettoriale per il corpus RAG, non puoi passare a un database diverso in un secondo momento.

Questo esempio di codice mostra come creare un corpus RAG con Pinecone senza fornire un nome di indice Pinecone o un nome di secret API. Utilizza l'API UpdateRagCorpus per specificare in un secondo momento le informazioni mancanti.

Python

import vertexai
from vertexai.preview import rag

# Set Project
PROJECT_ID = "YOUR_PROJECT_ID"
vertexai.init(project=PROJECT_ID, location="us-central1")

# Configure the Pinecone vector DB information
vector_db = rag.Pinecone()

# Name your corpus
DISPLAY_NAME = "YOUR_CORPUS_NAME"

rag_corpus = rag.create_corpus(display_name=DISPLAY_NAME, vector_db=vector_db)

REST

# Set your project ID under which you want to create the corpus
PROJECT_ID = "YOUR_PROJECT_ID"

# Choose a display name for your corpus
CORPUS_DISPLAY_NAME=YOUR_CORPUS_DISPLAY_NAME

# Call CreateRagCorpus API with all the Vector DB information.
# You can also add the embedding model choice or set other RAG corpus parameters on
# this call per your choice.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com}/v1beta1/projects/${PROJECT_ID}/locations/us-central1/ragCorpora -d '{
      "display_name" : '\""${CORPUS_DISPLAY_NAME}"\"',
      "rag_vector_db_config" : {
         "pinecone": {}
      }
   }'

# To poll the status of your RAG corpus creation, get the operation_id returned in
# response of your CreateRagCorpus call.
OPERATION_ID="YOUR_OPERATION_ID"

# Poll Operation status until done = true in the response.
# The response to this call will contain the ID for your created RAG corpus
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/us-central1/operations/${OPERATION_ID}

Aggiorna il corpus RAG

L'API UpdateRagCorpus consente di aggiornare la configurazione del database vettoriale. Se il nome dell'indice Pinecone e la versione del secret della chiave API non sono stati impostati in precedenza, puoi utilizzare l'API Pinecone per aggiornare i campi. La scelta di un database vettoriale non può essere aggiornata. È facoltativo fornire il secret della chiave API. Tuttavia, se non specifichi il secret della chiave API, puoi importare i dati nel corpus RAG.

Campo	Modificabilità	Obbligatorio o facoltativo
`rag_vector_db_config.vector_db`	Immutabile dopo aver effettuato una scelta.	Obbligatorio
`rag_vector_db_config.pinecone.index_name`	Immutabile dopo aver impostato il campo nel corpus RAG.	Obbligatorio
`rag_vector_db_config.api_auth.api_key_config.api_key_secret_version`	Modificabile. Dopo aver impostato la chiave API, non puoi eliminarla.	Facoltativo

Python

import vertexai
from vertexai.preview import rag

# Set Project
PROJECT_ID = "YOUR_PROJECT_ID"
vertexai.init(project=PROJECT_ID, location="us-central1")

# Configure the Pinecone vector DB information
vector_db = rag.Pinecone(index_name=)

# Name your corpus
DISPLAY_NAME = "YOUR_CORPUS_NAME"

rag_corpus = rag.create_corpus(display_name=DISPLAY_NAME, vector_db=vector_db)

REST

# Set your project ID for the corpus that you want to create.
PROJECT_ID = "YOUR_PROJECT_ID"

# Set your Pinecone index name
PINECONE_INDEX_NAME=YOUR_INDEX_NAME

# Set the full resource name of your secret. Follows the format
# projects/{PROJECT_NUMER}/secrets/{SECRET_ID}/versions/{VERSION_ID}
SECRET_RESOURCE_NAME=YOUR_SECRET_RESOURCE_NAME

# Call UpdateRagCorpus API with the Vector DB information.
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com}/v1beta1/projects/${PROJECT_ID}/locations/us-central1/ragCorpora -d '{
      "rag_vector_db_config" : {
         "pinecone": {"index_name": '\""${PINECONE_INDEX_NAME}"\"'},
         "api_auth": {"api_key_config":
               {"api_key_secret_version": '\""${SECRET_RESOURCE_NAME}"\"'}
         }
      }
   }'

# To poll the status of your RAG corpus creation, get the operation_id returned in
# response of your CreateRagCorpus call.
OPERATION_ID="YOUR_OPERATION_ID"

# Poll Operation status until done = true in the response.
# The response to this call will contain the ID for your created RAG corpus
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/us-central1/operations/${OPERATION_ID}

Passaggi successivi

Utilizza la ricerca vettoriale di Gemini Enterprise Agent Platform con RAG Engine

Utilizzare Pinecone con RAG Engine Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Valuta se utilizzare Pinecone con RAG Engine

Crea l'indice Pinecone

Crea la chiave API Pinecone

Archivia la chiave API in Secret Manager

Provisioning del account di servizio RAG Engine

Prepara il corpus RAG

Crea il corpus RAG

Python

REST

Crea un corpus RAG senza un nome di indice o una chiave API

Python

REST

Aggiorna il corpus RAG

Python

REST

Passaggi successivi

Utilizzare Pinecone con RAG Engine