Configurar un almacén de datos de Box

En esta página se describe cómo crear un almacén de datos y conectar Box a Gemini Enterprise.

Antes de empezar

Antes de configurar la conexión de Box, asegúrate de hacer lo siguiente:

  1. Asigna el rol de editor de Discovery Engine (roles/discoveryengine.editor). Este rol es obligatorio para que el usuario pueda crear el almacén de datos. Para conceder este rol, haz lo siguiente:
    1. En la consola, ve a la página Gestión de identidades y accesos. Google Cloud

      Ir a IAM

    2. Busca la cuenta de usuario y haz clic en el icono de editar Editar.
    3. Asigna el rol Discovery Engine Editor al usuario. Para obtener más información, consulta Roles y permisos de gestión de identidades y accesos.
  2. Crea y autoriza la cuenta de la aplicación Box.
  3. Configura Box y define los permisos necesarios. Para ver la lista de los ámbitos necesarios para la búsqueda y la ingesta de datos, consulta Permisos necesarios.
  4. Obtenga la información de autenticación que se usará durante la creación del almacén de datos.
  5. Configura un Google Cloud proyecto con una cuenta de administrador que pueda gestionar las configuraciones a nivel de organización para que la organización pueda configurar un grupo de trabajadores.
  6. Asegúrate de que tu organización esté configurada para gestionar un grupo de trabajadores.

Crear el almacén de datos de Box

Para crear el almacén de datos de Box, sigue estos pasos:

  1. En la Google Cloud consola, ve a la página de Gemini Enterprise.

    Gemini Enterprise

  2. Selecciona o crea un Google Cloud proyecto.

  3. En el menú de navegación, haga clic en Almacenes de datos.

  4. Haz clic en Crear almacén de datos.

  5. En la sección Source (Fuente), busca Box y haz clic en Select (Seleccionar).

  6. En la sección Datos:

    1. En la sección Modo de conector, selecciona Búsqueda federada o Ingestión de datos como modo de conexión.
    2. Haz clic en Continuar.

    3. En la sección Configuración de autenticación, configura la autenticación según el modo de conexión que hayas elegido.

      • Si has seleccionado Búsqueda federada, introduce los siguientes datos:

        • ID de cliente: el identificador único de tu aplicación de Box.
        • Secreto de cliente: la clave secreta asociada a tu aplicación de Box.
      • Si has seleccionado Ingestión de datos, introduce los siguientes detalles:

        • ID de empresa: el identificador único de tu empresa de Box.
        • ID de cliente: el identificador público de tu aplicación de Box.
        • Secreto de cliente: la clave secreta asociada a tu aplicación de Box.
        • URI de instancia: la URL base de la API de tu instancia de Box.
        • Clave privada: clave privada que se usa para autenticar tu aplicación Box.
        • ID de clave: identificador de la clave privada.
        • Frase de contraseña: la frase de contraseña que se usa para descifrar la clave privada.

        Para ver la lista de los ámbitos necesarios para la búsqueda y la ingestión de datos, consulta Ámbitos necesarios. Para obtener información sobre cómo obtener información de autenticación, consulta Obtener información de autenticación de Box.

      • Si has seleccionado Búsqueda federada, haz clic en Iniciar sesión y completa el proceso.

    4. Haz clic en Continuar.

    5. En la sección Opciones avanzadas:

      • Si ha seleccionado Búsqueda federada, elija el modo de suplantación de identidad como Admin o User y haga clic en Continuar.
      • Opcional. Si ha seleccionado Ingestión de datos, marque la casilla Habilitar direcciones IP estáticas para permitir un conjunto de direcciones IP estáticas en su sistema.
    6. Haz clic en Continuar.

    7. En la sección Entidades que buscar (si ha seleccionado Búsqueda federada) o Entidades que sincronizar (si ha seleccionado Ingestión de datos):

      1. Selecciona todas las entidades necesarias.
      2. Si ha seleccionado Ingestión de datos, siga estos pasos:
        1. Opcional: Para sincronizar proyectos específicos, haz lo siguiente:
          1. Haz clic en Filtrar.
          2. Para excluir entidades del índice, selecciona la casilla Excluir del índice. Para incluirlas, selecciona la casilla Incluir en el índice.
          3. Introduce las llaves. Pulsa Intro después de cada tecla.
          4. Haz clic en Guardar.
        2. Para configurar la programación de sincronización, sigue estos pasos:
          1. En la lista Frecuencia de sincronización, seleccione la frecuencia de sincronización.
            • Para programar sincronizaciones completas independientes de los datos de entidad y de identidad, despliega el menú de la sección Sincronización completa y selecciona Opciones personalizadas.
          2. En la lista Frecuencia de sincronización incremental, seleccione la frecuencia de sincronización incremental. Para obtener más información, consulta Programaciones de sincronización.
  7. Haz clic en Continuar.

  8. En la sección Configuración:

    1. En la lista Multirregión, selecciona la ubicación del conector de datos.
    2. En el campo Nombre del conector de datos, escriba un nombre para el conector.
    3. Si has seleccionado US o EU como ubicación, configura los ajustes de cifrado:
      • Opcional: Si no ha configurado claves de una sola región, haga clic en Ir a la página de configuración para hacerlo. Para obtener más información, consulte Registrar una clave de una sola región para conectores de terceros.
      • Selecciona Clave de cifrado gestionada porGoogle o Clave de Cloud KMS.
      • Si has seleccionado Clave de Cloud KMS:
        • En la lista Tipo de gestión de claves, selecciona el tipo adecuado.
        • En la lista Clave de Cloud KMS, selecciona la clave.
      Para obtener más información, consulta Claves de cifrado gestionadas por el cliente.

  9. Haz clic en Continuar.

  10. En la sección Facturación, seleccione Precios generales o Precios configurables. Para obtener más información, consulta Verificar el estado de facturación de tus proyectos y Licencias.

  11. Haz clic en Crear. Gemini Enterprise crea tu almacén de datos y lo muestra en la página Almacenes de datos.

Para verificar el estado del almacén de datos, haz lo siguiente:

  1. Ve al almacén de datos en la lista de almacenes de datos y monitoriza su estado hasta que cambie a Activo.
  2. Cuando el estado del almacén de datos cambia de Creando a Activo, el conector de Box está listo para usarse.

En el caso de un almacén de datos de ingestión creado con Box, el estado del almacén de datos pasa de Creating (Creando) a Running (En ejecución) al iniciar la sincronización. Después, cambia a Activo cuando se completa la ingestión, lo que indica que el almacén de datos está totalmente configurado. En función del volumen de datos, la ingestión puede tardar varias horas.

Si has creado un almacén de datos federado de Box, debes autorizar Gemini Enterprise en Box antes de ejecutar la consulta.

Gestión de datos y ejecución de consultas

En esta sección se describe cómo gestiona Gemini Enterprise tu consulta y las implicaciones para la privacidad del uso del almacén de datos federado.

Ejecución de consultas

Después de autorizar Box y enviar una consulta de búsqueda a Gemini Enterprise:

  • Gemini Enterprise envía tu consulta de búsqueda directamente a la API de Box.
  • Gemini Enterprise combina los resultados con los de otras fuentes de datos conectadas y muestra un resultado de búsqueda completo.

Tratamiento de datos

Cuando se usa la búsqueda federada de terceros, se aplican las siguientes reglas de tratamiento de datos:

  • La cadena de consulta se envía al backend de búsqueda de terceros (API de Box).
  • Estos terceros pueden asociar las consultas con tu identidad.
  • Si hay varias fuentes de datos de búsqueda federada habilitadas, la consulta se puede enviar a todas ellas.
  • Una vez que los datos llegan al sistema de terceros, se rigen por los términos del servicio y las políticas de privacidad de ese sistema.

Siguientes pasos