Configure controlos de acesso para origens de dados personalizadas

Esta página descreve como aplicar o controlo de acesso à origem de dados (também denominado LCAs) para apps de pesquisa que cria através do Cloud Storage ou do BigQuery.

Vista geral

O controlo de acesso às suas origens de dados no Gemini Enterprise limita os dados que os utilizadores podem ver nos resultados da app de pesquisa. A Google usa o seu fornecedor de identidade para identificar o utilizador final que está a fazer uma pesquisa e determinar se tem acesso aos documentos devolvidos como resultados.

Por exemplo, suponhamos que os funcionários da sua empresa pesquisam documentos do BigQuery através da sua app de pesquisa. No entanto, tem de se certificar de que não podem ver conteúdo através da app ao qual não têm autorização de acesso. Se tiver configurado um grupo de pessoal no Google Cloud para o fornecedor de identidade da sua organização, também pode especificar esse grupo de pessoal no Gemini Enterprise. Agora, se um funcionário usar a sua app, recebe resultados da pesquisa apenas para documentos aos quais a sua conta já tem acesso no BigQuery.

A ativação do controlo de acesso é um procedimento único. Para aplicar o controlo de acesso a uma origem de dados do BigQuery ou do Cloud Storage, siga os passos abaixo, consoante o tipo de dados, como dados estruturados ou não estruturados.

Dados não estruturados do Cloud Storage

Quando configurar um repositório de dados para dados não estruturados do Cloud Storage, também tem de carregar metadados da ACL e definir o repositório de dados como controlado por acesso:

  1. Quando preparar os dados, inclua informações da ACL nos metadados através do campo acl_info. Por exemplo:

    {
       "id": "<your-id>",
       "jsonData": "<JSON string>",
       "content": {
         "mimeType": "<application/pdf or text/html>",
         "uri": "gs://<your-gcs-bucket>/directory/filename.pdf"
       },
       "acl_info": {
         "readers": [
           {
             "principals": [
               { "group_id": "group_1" },
               { "user_id": "user_1" }
             ]
           }
         ]
       }
     }
    

    Para mais informações sobre dados não estruturados com metadados, consulte a secção Dados não estruturados do artigo Prepare os dados para carregamento.

  2. Quando seguir os passos para a criação de um repositório de dados em Crie um repositório de dados originais, pode ativar o controlo de acesso fazendo o seguinte na consola ou através da API:

    • Console: quando criar um arquivo de dados, selecione Este arquivo de dados contém informações de controlo de acesso durante a criação do arquivo de dados.
    • API: quando criar o arquivo de dados, inclua o campo "aclEnabled": "true" no seu payload JSON.
  3. Quando seguir os passos para a importação de dados em Crie um armazenamento de dados originais, certifique-se de que faz o seguinte:

    • Carregue os metadados com informações da ACL do mesmo contentor que os seus dados não estruturados
    • Se usar a API, defina GcsSource.dataSchema como document

Dados estruturados do Cloud Storage

Quando configurar um arquivo de dados para dados estruturados do Cloud Storage, também tem de carregar metadados da ACL e definir o arquivo de dados como controlado por acesso:

  1. Quando preparar os dados, inclua informações da ACL nos metadados através do campo acl_info. Por exemplo:

    {
       "id": "<your-id>",
       "jsonData": "<JSON string>",
       "acl_info": {
         "readers": [
           {
             "principals": [
               { "group_id": "group_1" },
               { "user_id": "user_1" }
             ]
           }
         ]
       }
     }
    
  2. Quando seguir os passos para a criação de um repositório de dados em Crie um repositório de dados originais, pode ativar o controlo de acesso através dos seguintes passos na consola ou com a API:

    • Console: quando criar um arquivo de dados, selecione Este arquivo de dados contém informações de controlo de acesso durante a criação do arquivo de dados.
    • API: quando criar o arquivo de dados, inclua o campo "aclEnabled": "true" no seu payload JSON.
  3. Quando seguir os passos para a importação de dados em Crie um arquivo de dados originais, certifique-se de que faz o seguinte:

    • Carregue os metadados com informações da ACL do mesmo contentor que os seus dados estruturados
    • Se usar a API, defina GcsSource.dataSchema como document

Dados não estruturados do BigQuery

Quando configura um repositório de dados para dados não estruturados do BigQuery, tem de definir o repositório de dados como controlado por acesso e fornecer metadados de LCA através de um esquema predefinido para o Gemini Enterprise:

  1. Quando preparar os dados, especifique o seguinte esquema. Não use um esquema personalizado.

    [
      {
        "name": "id",
        "mode": "REQUIRED",
        "type": "STRING",
        "fields": []
      },
      {
        "name": "jsonData",
        "mode": "NULLABLE",
        "type": "STRING",
        "fields": []
      },
      {
        "name": "content",
        "type": "RECORD",
        "mode": "NULLABLE",
        "fields": [
          {
            "name": "mimeType",
            "type": "STRING",
            "mode": "NULLABLE"
          },
          {
            "name": "uri",
            "type": "STRING",
            "mode": "NULLABLE"
          }
        ]
      },
      {
        "name": "acl_info",
        "type": "RECORD",
        "mode": "NULLABLE",
        "fields": [
          {
            "name": "readers",
            "type": "RECORD",
            "mode": "REPEATED",
            "fields": [
              {
                "name": "principals",
                "type": "RECORD",
                "mode": "REPEATED",
                "fields": [
                  {
                    "name": "user_id",
                    "type": "STRING",
                    "mode": "NULLABLE"
                  },
                  {
                    "name": "group_id",
                    "type": "STRING",
                    "mode": "NULLABLE"
                  }
                ]
              }
            ]
          }
        ]
      }
    ]
    
  2. Inclua os metadados da ACL como uma coluna na tabela do BigQuery.

  3. Quando seguir os passos em Crie um arquivo de dados originais, ative o controlo de acesso na consola ou através da API:

    • Console: quando criar um arquivo de dados, selecione Este arquivo de dados contém informações de controlo de acesso durante a criação do arquivo de dados.
    • API: quando criar o arquivo de dados, inclua o campo "aclEnabled": "true" no seu payload JSON.
  4. Quando seguir os passos para a importação de dados em Crie um armazenamento de dados originais, se usar a API, defina BigQuerySource.dataSchema como document.

Dados estruturados do BigQuery

Quando configurar um repositório de dados para dados estruturados do BigQuery, tem de definir o repositório de dados como controlado por acesso e fornecer metadados de LCA através de um esquema predefinido para o Gemini Enterprise:

  1. Quando preparar os dados, especifique o seguinte esquema. Não use um esquema personalizado.

    [
      {
        "name": "id",
        "mode": "REQUIRED",
        "type": "STRING",
        "fields": []
      },
      {
        "name": "jsonData",
        "mode": "NULLABLE",
        "type": "STRING",
        "fields": []
      },
      {
        "name": "acl_info",
        "type": "RECORD",
        "mode": "NULLABLE",
        "fields": [
          {
            "name": "readers",
            "type": "RECORD",
            "mode": "REPEATED",
            "fields": [
              {
                "name": "principals",
                "type": "RECORD",
                "mode": "REPEATED",
                "fields": [
                  {
                    "name": "user_id",
                    "type": "STRING",
                    "mode": "NULLABLE"
                  },
                  {
                    "name": "group_id",
                    "type": "STRING",
                    "mode": "NULLABLE"
                  }
                ]
              }
            ]
          }
        ]
      }
    ]
    
  2. Inclua os metadados da ACL como uma coluna na tabela do BigQuery.

  3. Quando seguir os passos em Crie um arquivo de dados originais, ative o controlo de acesso na consola ou através da API:

    • Console: quando criar um arquivo de dados, selecione Este arquivo de dados contém informações de controlo de acesso durante a criação do arquivo de dados.
    • API: quando criar o arquivo de dados, inclua o campo "aclEnabled": "true" no seu payload JSON.
  4. Quando seguir os passos para a importação de dados em Crie um armazenamento de dados originais, certifique-se de que faz o seguinte:

    • Se usar a consola, quando especificar o tipo de dados que está a carregar, selecione JSONL para dados estruturados com metadados.
    • Se usar a API, defina BigQuerySource.dataSchema como document.