Antes de começar
Este tutorial pressupõe que você leu e seguiu as instruções em:
- Desenvolver um agente LlamaIndexQueryPipeline: para desenvolver
agent
como uma instância deLlamaIndexQueryPipelineAgent
. - Autenticação de usuário para se autenticar como um usuário e consultar o agente.
- Importe e inicialize o SDK para inicializar o cliente e receber uma instância implantada (se necessário).
Receber uma instância de um agente
Para consultar um LlamaIndexQueryPipelineAgent
, primeiro crie uma instância ou acesse uma instância atual.
Para receber o LlamaIndexQueryPipelineAgent
correspondente a um ID de recurso específico:
SDK da Vertex AI para Python
Execute o seguinte código:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
agent = client.agent_engines.get(name="projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID")
print(agent)
em que
PROJECT_ID
é o ID do projeto do Google Cloud em que você desenvolve e implanta agentes.LOCATION
é uma das regiões com suporte.RESOURCE_ID
é o ID do agente implantado como um recurso reasoningEngine
.
Biblioteca de solicitações do Python
Execute o seguinte código:
from google import auth as google_auth
from google.auth.transport import requests as google_requests
import requests
def get_identity_token():
credentials, _ = google_auth.default()
auth_request = google_requests.Request()
credentials.refresh(auth_request)
return credentials.token
response = requests.get(
f"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID",
headers={
"Content-Type": "application/json; charset=utf-8",
"Authorization": f"Bearer {get_identity_token()}",
},
)
API REST
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Ao usar o SDK da Vertex AI para Python, o objeto agent
corresponde a uma
classe AgentEngine
que contém o seguinte:
- um
agent.api_resource
com informações sobre o agente implantado. Você também pode chamaragent.operation_schemas()
para retornar a lista de operações compatíveis com o agente. Consulte Operações compatíveis para mais detalhes. - um
agent.api_client
que permite interações de serviço síncronas - um
agent.async_api_client
que permite interações assíncronas de serviço
O restante desta seção pressupõe que você tenha uma instância AgentEngine
chamada agent
.
Operações suportadas
As seguintes operações são compatíveis com LlamaIndexQueryPipelineAgent
:
query
: para receber uma resposta a uma consulta de forma síncrona.
O método query
aceita o seguinte tipo de argumento:
input
: as mensagens a serem enviadas ao agente.
Consultar o agente
O comando:
agent.query(input="What is Paul Graham's life in college?")
é equivalente ao seguinte (na forma completa):
agent.query(input={"input": "What is Paul Graham's life in college?"})
Para personalizar o dicionário de entrada, consulte Personalizar o modelo de comando.
Também é possível personalizar o comportamento do agente além de input
transmitindo outros argumentos de palavra-chave para query()
.
response = agent.query(
input={
"input" = [
"What is Paul Graham's life in college?",
"How did Paul Graham's college experience shape his career?",
"How did Paul Graham's college experience shape his entrepreneurial mindset?",
],
},
batch=True # run the pipeline in batch mode and pass a list of inputs.
)
print(response)
Consulte o código QueryPipeline.run
para ver uma lista completa de parâmetros disponíveis.