Sobre apps e repositórios de dados

Nesta página, descrevemos os apps e repositórios de dados do Gemini Enterprise.

Com o Gemini Enterprise, você cria um app e o conecta a um repositório de dados. Um determinado projeto Google Cloud pode conter vários apps.

Termos-chave:

  • App: um app do Gemini Enterprise oferece resultados de pesquisa, ações e agentes aos usuários finais. O termo app pode ser usado de forma intercambiável com o termo engine no contexto das APIs.

  • Repositório de dados: é uma entidade que contém os dados ingeridos de uma fonte de dados próprios, como o Cloud Storage, ou de aplicativos de terceiros, como o Jira ou o Salesforce. Os repositórios de dados que contêm dados de aplicativos de terceiros também são chamados de conectores de dados.

Relação entre apps e repositórios de dados

Um app precisa estar conectado a um repositório de dados para usar as informações dele e mostrar resultados da pesquisa, respostas ou ações.

Os apps têm uma relação de muitos para muitos com os repositórios de dados. Quando vários repositórios de dados estão conectados a um único app, isso é chamado de pesquisa combinada. Para informações sobre as limitações de conectar um app de pesquisa a mais de um repositório de dados, consulte Sobre a pesquisa combinada.

Método de criação de apps e ingestão de dados

A forma de criar um app e ingerir dados depende do tipo de dados que você tem:

  • Para dados de terceiros, use o console do Google Cloud , não a API, para criar seu app e ingerir dados.

  • Para outros dados, use o console do Google Cloud ou a API.

Documentos

Cada repositório de dados tem um ou mais registros de dados, chamados de documentos. O que um documento representa varia dependendo do tipo de dados no repositório de dados:

  • Dados de origens de dados de terceiros. Um documento é uma entidade específica da fonte de dados de terceiros, como um problema do Jira ou um espaço do Confluence.

  • Dados estruturados. Um documento é uma linha em uma tabela ou um registro JSON que segue um esquema específico. Você pode incluir o esquema ou deixar que o Gemini Enterprise derive o esquema nos dados ingeridos.

  • Dados não estruturados. Um documento é um arquivo em HTML, PDF com texto incorporado ou formato TXT. Os formatos PPTX e DOCX estão disponíveis na prévia.

Repositórios de dados e apps

No Gemini Enterprise, há vários tipos de repositórios de dados. Um repositório de dados pode conter apenas um tipo de dado.

Dados estruturados para repositórios de dados de terceiros

Os seguintes conectores de fontes de dados de terceiros estão disponíveis na prévia com lista de permissões:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Os dados desses terceiros são considerados estruturados.

Ao configurar um novo conector, você seleciona uma frequência de sincronização. Você também pode selecionar quais entidades sincronizar. As entidades variam de acordo com a origem, como problemas para o Jira e conteúdo e espaços para o Confluence. Um repositório de dados exclusivo é criado para cada entidade. Os repositórios de dados de entidades são agrupados por instância de conector.

A seguir

Dados estruturados

Um repositório de dados com dados estruturados permite a pesquisa semântica ou recomendações com dados estruturados. É possível importar dados do BigQuery ou do Cloud Storage. Também é possível fazer upload manual de dados JSON estruturados usando a API.

Por exemplo, ative pesquisa ou recomendações com um catálogo de produtos para sua experiência de e-commerce ou um diretório de médicos para pesquisar ou sugerir profissionais.

O Gemini Enterprise detecta automaticamente o esquema dos dados importados. Se quiser, você pode fornecer um esquema para seus dados. Fornecer um esquema para seus dados geralmente melhora a qualidade dos resultados.

A seguir

Dados não estruturados

Um repositório de dados não estruturados permite a pesquisa semântica ou recomendações com dados como documentos e imagens.

Os repositórios de dados não estruturados aceitam documentos em HTML, PDF com texto incorporado e formato TXT. Os formatos PPTX e DOCX estão disponíveis na prévia.

A Pesquisa fornece resultados na forma de 10 URLs e respostas resumidas para consultas em linguagem natural. Os documentos precisam ser enviados para um bucket do Cloud Storage com as permissões de acesso adequadas. Por exemplo, uma instituição financeira pode ativar a pesquisa ou recomendações no próprio corpus particular de publicações de pesquisa financeira, ou uma empresa de biotecnologia pode ativar a pesquisa ou recomendações no próprio repositório particular de pesquisa médica.

A seguir

Sobre a pesquisa combinada

Com a pesquisa combinada, vários repositórios de dados podem ser conectados a um único app. Isso permite que o app pesquise em várias fontes e tipos de dados.

Para criar um app de pesquisa combinada, selecione vários repositórios de dados ao criar um novo app. Se você não selecionar vários repositórios de dados durante a criação, não será possível adicionar outros depois.

Ao receber resultados da pesquisa, você pode pesquisar em todos os repositórios de dados ou filtrar os resultados de um único repositório de dados.

A pesquisa combinada tem as seguintes limitações:

  • Adicionar e remover repositórios de dados:
    • Para ativar a pesquisa combinada em um app, conecte pelo menos dois repositórios de dados a ele durante a criação.
    • É possível adicionar ou remover repositórios de dados de um app de pesquisa combinada, mas o app não pode ter menos de dois repositórios conectados a ele a qualquer momento.
    • Se você conectar um único repositório de dados a um app de pesquisa durante a criação do app, não será possível adicionar ou remover esse repositório.
  • Não há suporte para repositórios de dados com dados não estruturados importados usando o BigQuery.
  • A pesquisa combinada permite os seguintes campos em solicitações de pesquisa:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • A pesquisa combinada permite os seguintes campos em dataStoreSpecs:
    • dataStore
    • boostSpec: se houver especificações de reforço para SearchRequest e dataStoreSpecs, ambas serão aplicadas aos resultados da pesquisa.
    • filter: se houver filtros especificados para SearchRequest e dataStoreSpecs, os dois serão aplicados aos resultados da pesquisa.
  • As operações de criação, leitura, atualização e exclusão (CRUD) em configurações de exibição são compatíveis com apps combinados. Somente os seguintes campos podem ser adicionados ou atualizados em uma configuração de veiculação:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • As operações CRUD nos seguintes controles são compatíveis com apps de pesquisa combinada:
    • boostAction
    • synonymAction
    • filterAction
  • Há um limite de 50 repositórios de dados por app de pesquisa.
  • Se um repositório de dados usar uma configuração de CMEK, todos os outros também precisarão usar a mesma configuração.