Nesta página, descrevemos os apps e repositórios de dados do Gemini Enterprise.
Com o Gemini Enterprise, você cria um app e o conecta a um repositório de dados. Um determinado projeto Google Cloud pode conter vários apps.
Termos-chave:
App: um app do Gemini Enterprise oferece resultados de pesquisa, ações e agentes aos usuários finais. O termo app pode ser usado de forma intercambiável com o termo engine no contexto das APIs.
Repositório de dados: é uma entidade que contém os dados ingeridos de uma fonte de dados próprios, como o Cloud Storage, ou de aplicativos de terceiros, como o Jira ou o Salesforce. Os repositórios de dados que contêm dados de aplicativos de terceiros também são chamados de conectores de dados.
Relação entre apps e repositórios de dados
Um app precisa estar conectado a um repositório de dados para usar as informações dele e mostrar resultados da pesquisa, respostas ou ações.
Os apps têm uma relação de muitos para muitos com os repositórios de dados. Quando vários repositórios de dados estão conectados a um único app, isso é chamado de pesquisa combinada. Para informações sobre as limitações de conectar um app de pesquisa a mais de um repositório de dados, consulte Sobre a pesquisa combinada.
Método de criação de apps e ingestão de dados
A forma de criar um app e ingerir dados depende do tipo de dados que você tem:
Para dados de terceiros, use o console do Google Cloud , não a API, para criar seu app e ingerir dados.
Para outros dados, use o console do Google Cloud ou a API.
Documentos
Cada repositório de dados tem um ou mais registros de dados, chamados de documentos. O que um documento representa varia dependendo do tipo de dados no repositório de dados:
Dados de origens de dados de terceiros. Um documento é uma entidade específica da fonte de dados de terceiros, como um problema do Jira ou um espaço do Confluence.
Dados estruturados. Um documento é uma linha em uma tabela ou um registro JSON que segue um esquema específico. Você pode incluir o esquema ou deixar que o Gemini Enterprise derive o esquema nos dados ingeridos.
Dados não estruturados. Um documento é um arquivo em HTML, PDF com texto incorporado ou formato TXT. Os formatos PPTX e DOCX estão disponíveis na prévia.
Repositórios de dados e apps
No Gemini Enterprise, há vários tipos de repositórios de dados. Um repositório de dados pode conter apenas um tipo de dado.
Dados estruturados para repositórios de dados de terceiros
Os seguintes conectores de fontes de dados de terceiros estão disponíveis na prévia com lista de permissões:
- Confluence
- Jira
- Salesforce
- SharePoint Online
- Slack
Os dados desses terceiros são considerados estruturados.
Ao configurar um novo conector, você seleciona uma frequência de sincronização. Você também pode selecionar quais entidades sincronizar. As entidades variam de acordo com a origem, como problemas para o Jira e conteúdo e espaços para o Confluence. Um repositório de dados exclusivo é criado para cada entidade. Os repositórios de dados de entidades são agrupados por instância de conector.
A seguir
Dados estruturados
Um repositório de dados com dados estruturados permite a pesquisa semântica ou recomendações com dados estruturados. É possível importar dados do BigQuery ou do Cloud Storage. Também é possível fazer upload manual de dados JSON estruturados usando a API.
Por exemplo, ative pesquisa ou recomendações com um catálogo de produtos para sua experiência de e-commerce ou um diretório de médicos para pesquisar ou sugerir profissionais.
O Gemini Enterprise detecta automaticamente o esquema dos dados importados. Se quiser, você pode fornecer um esquema para seus dados. Fornecer um esquema para seus dados geralmente melhora a qualidade dos resultados.
A seguir
- Prepare dados estruturados para ingestão.
- Crie um repositório de dados de pesquisa usando um destes métodos:
- Crie um app.
Dados não estruturados
Um repositório de dados não estruturados permite a pesquisa semântica ou recomendações com dados como documentos e imagens.
Os repositórios de dados não estruturados aceitam documentos em HTML, PDF com texto incorporado e formato TXT. Os formatos PPTX e DOCX estão disponíveis na prévia.
A Pesquisa fornece resultados na forma de 10 URLs e respostas resumidas para consultas em linguagem natural. Os documentos precisam ser enviados para um bucket do Cloud Storage com as permissões de acesso adequadas. Por exemplo, uma instituição financeira pode ativar a pesquisa ou recomendações no próprio corpus particular de publicações de pesquisa financeira, ou uma empresa de biotecnologia pode ativar a pesquisa ou recomendações no próprio repositório particular de pesquisa médica.
A seguir
- Preparar dados não estruturados para ingestão.
- Crie um repositório de dados de pesquisa usando um destes métodos:
- Crie um repositório de dados próprios para seus dados não estruturados.
- Crie um app.
Sobre a pesquisa combinada
Com a pesquisa combinada, vários repositórios de dados podem ser conectados a um único app. Isso permite que o app pesquise em várias fontes e tipos de dados.
Para criar um app de pesquisa combinada, selecione vários repositórios de dados ao criar um novo app. Se você não selecionar vários repositórios de dados durante a criação, não será possível adicionar outros depois.
Ao receber resultados da pesquisa, você pode pesquisar em todos os repositórios de dados ou filtrar os resultados de um único repositório de dados.
A pesquisa combinada tem as seguintes limitações:
- Adicionar e remover repositórios de dados:
- Para ativar a pesquisa combinada em um app, conecte pelo menos dois repositórios de dados a ele durante a criação.
- É possível adicionar ou remover repositórios de dados de um app de pesquisa combinada, mas o app não pode ter menos de dois repositórios conectados a ele a qualquer momento.
- Se você conectar um único repositório de dados a um app de pesquisa durante a criação do app, não será possível adicionar ou remover esse repositório.
- Não há suporte para repositórios de dados com dados não estruturados importados usando o BigQuery.
- A pesquisa combinada permite os seguintes campos em solicitações de pesquisa:
boostSpec
contentSearchSpec
dataStoreSpecs
facetSpecs
filter
languageCode
offset
oneBoxPageSize
orderBy
query
pageSize
pageToken
relevanceScoreSpec
relevanceThreshold
session
sessionSpec
spellCorrectionSpec
userInfo
userPseudoId
- A pesquisa combinada permite os seguintes campos em
dataStoreSpecs
:dataStore
boostSpec
: se houver especificações de reforço paraSearchRequest
edataStoreSpecs
, ambas serão aplicadas aos resultados da pesquisa.filter
: se houver filtros especificados paraSearchRequest
edataStoreSpecs
, os dois serão aplicados aos resultados da pesquisa.
- As operações de criação, leitura, atualização e exclusão (CRUD) em configurações de exibição são
compatíveis com apps combinados. Somente os seguintes campos podem ser adicionados ou atualizados
em uma configuração de veiculação:
boostControlIds
displayName
filterControlIds
genericConfig
:contentSearchSpec
name
solutionType
synonymsControlIds
- As operações CRUD nos seguintes controles são compatíveis com apps de pesquisa combinada:
boostAction
synonymAction
filterAction
- Há um limite de 50 repositórios de dados por app de pesquisa.
- Se um repositório de dados usar uma configuração de CMEK, todos os outros também precisarão usar a mesma configuração.