Acerca de las apps y los almacenes de datos

En esta página, se describen las apps y los almacenes de datos de Gemini Enterprise.

Con Gemini Enterprise, creas una app y la conectas a un almacén de datos. Un proyecto Google Cloud determinado puede contener varias apps.

Términos clave:

  • App: Una app de Gemini Enterprise proporciona resultados de la búsqueda, acciones y agentes a tus usuarios finales. El término app se puede usar indistintamente con el término motor en el contexto de las APIs.

  • Almacén de datos: Un almacén de datos es una entidad que contiene los datos transferidos desde una fuente de datos de origen, como Cloud Storage, o aplicaciones de terceros como Jira o Salesforce. Los almacenes de datos que contienen datos de aplicaciones de terceros también se denominan conectores de datos.

Relación entre las apps y los almacenes de datos

Una app debe estar conectada a un almacén de datos para usar los datos de este y mostrar resultados de la búsqueda, respuestas o acciones.

Las apps tienen una relación de varios a varios con los almacenes de datos. Cuando varios almacenes de datos están conectados a una sola app, se denomina búsqueda combinada. Para obtener información sobre las limitaciones de conectar una app de búsqueda a más de un almacén de datos, consulta Acerca de la búsqueda combinada.

Método de creación de apps y transferencia de datos

La forma en que creas una app y transfieres datos depende del tipo de datos que tengas:

  • Para los datos de terceros, usas la Google Cloud consola, no la API, para crear tu app y transferir datos.

  • Para otros datos, puedes usar la Google Cloud consola o la API.

Documentos

Cada almacén de datos tiene uno o más registros de datos, llamados documentos. Lo que un documento representa varía según el tipo de datos en el almacén de datos:

  • Datos para fuentes de datos de terceros : Un documento es una entidad específica de la fuente de datos de terceros, como una incidencia de Jira o un espacio de Confluence.

  • Datos estructurados : Un documento es una fila en una tabla o un registro JSON que sigue un esquema en particular. El usuario puede especificar este esquema o dejar que Gemini Enterprise lo defina a partir de los datos transferidos.

  • Datos no estructurados : Un documento es un archivo en formato HTML, PDF con texto incorporado o TXT. Los formatos PPTX y DOCX están disponibles en versión preliminar.

Almacenes de datos y apps

En Gemini Enterprise, hay varios tipos de almacenes de datos. Un almacén de datos puede contener solo un tipo de datos.

Datos estructurados para almacenes de datos de terceros

Los siguientes conectores de fuentes de datos de terceros están disponibles en versión preliminar con lista de entidades permitidas:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Los datos de estos terceros se consideran datos estructurados.

Cuando configuras un conector nuevo, seleccionas una frecuencia de sincronización. También seleccionas las entidades que deseas sincronizar. Las entidades varían según la fuente, como las incidencias de Jira y el contenido y los espacios de Confluence. Se crea un almacén de datos único para cada entidad. Los almacenes de datos de entidades se agrupan por instancia de conector.

¿Qué sigue?

Datos estructurados

Un almacén de datos con datos estructurados permite la búsqueda semántica o recomendaciones sobre los datos estructurados. Puedes importar datos desde BigQuery o Cloud Storage. También puedes subir datos JSON estructurados de forma manual a través de la API.

Por ejemplo, puedes habilitar la búsqueda o recomendaciones sobre un catálogo de productos para tu experiencia de comercio electrónico o un directorio de médicos para búsqueda o recomendaciones de proveedores.

Gemini Enterprise detecta automáticamente el esquema de los datos que importas. De manera opcional, puedes proporcionar un esquema para tus datos. Proporcionar un esquema para tus datos suele mejorar la calidad de los resultados.

¿Qué sigue?

Datos no estructurados

Un almacén de datos no estructurados permite la búsqueda semántica o recomendaciones sobre datos como documentos e imágenes.

Los almacenes de datos no estructurados admiten documentos en formato HTML, PDF con texto incorporado y TXT. Los formatos PPTX y DOCX están disponibles en versión preliminar.

La Búsqueda proporciona resultados en forma de 10 URLs y respuestas resumidas para las consultas en lenguaje natural. Los documentos deben subirse a un bucket de Cloud Storage con los permisos de acceso correctos. Por ejemplo, una institución financiera puede habilitar la búsqueda o recomendaciones sobre su corpus privado de publicaciones de investigación financiera, o una empresa de biotecnología puede habilitar la búsqueda o recomendaciones sobre su repositorio privado de investigación médica.

¿Qué sigue?

Acerca de la búsqueda combinada

Con la búsqueda combinada, se pueden conectar varios almacenes de datos a una sola app. Esto permite que la app busque en varias fuentes y tipos de datos.

Para crear una app de búsqueda combinada, conecta uno o más almacenes de datos a una app después de que se haya creado.

Cuando obtienes resultados de la búsqueda, puedes buscar en todos los almacenes de datos o filtrar los resultados de un solo almacén de datos.

La búsqueda combinada tiene las siguientes limitaciones:

  • No se admiten los almacenes de datos que contienen datos no estructurados importados con BigQuery.
  • La búsqueda combinada permite los siguientes campos en las solicitudes de búsqueda:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La búsqueda combinada permite los siguientes campos en dataStoreSpecs:
    • dataStore
    • boostSpec: Si se especifican especificaciones de aumento para SearchRequest y dataStoreSpecs, ambas especificaciones de aumento se aplican a los resultados de la búsqueda.
    • filter: Si se especifican filtros para SearchRequest y dataStoreSpecs, ambos filtros se aplican a los resultados de la búsqueda.
  • Se admiten las operaciones de creación, lectura, actualización y eliminación (CRUD) en las configuraciones de publicación para apps combinadas. Solo se pueden agregar o actualizar los siguientes campos en una configuración de publicación:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Se admiten las operaciones CRUD en los siguientes controles para las apps de búsqueda combinada:
    • boostAction
    • synonymAction
    • filterAction
  • Hay un límite de 50 almacenes de datos por app de búsqueda.
  • Si un almacén de datos usa una configuración de CMEK, todos los demás almacenes de datos también deben usar la misma configuración de CMEK.