Usar o Gemini Cloud Assist

Este documento descreve como usar o Gemini Cloud Assist, um produto do portfólio Gemini para Google Cloud, para ajudar você a entender e trabalhar com seus metadados, jobs e consultas no BigQuery. Ele fornece casos de uso compatíveis e exemplos de comandos que podem ser usados no Gemini Cloud Assist.

Antes de começar

Antes de usar o Gemini Cloud Assist, o administrador precisa seguir as etapas para configurar o Gemini Cloud Assist no projeto ou pasta em que você está trabalhando.

Para responder a perguntas e solicitações sobre seus recursos do Google Cloud , o Gemini Cloud Assist precisa das permissões adequadas do Identity and Access Management (IAM) para esses recursos. O Gemini Cloud Assist herda suas permissões quando você pede para ele consultar seus dados do BigQuery. Portanto, em muitos casos, as permissões necessárias do IAM já estão concedidas. Para mais informações, consulte Requisitos do IAM para usar o Gemini Cloud Assist.

Usar o Gemini Cloud Assist

  1. Acessar a página do BigQuery.

    Acessar o BigQuery

  2. Na barra de ferramentas Google Cloud , clique em spark Abrir ou fechar o chat com IA do Gemini para abrir o chat do Gemini Cloud Assist.

    Botão do Gemini Cloud Assist na barra de ferramentas do BigQuery.

  3. No campo Insira um comando, digite seu comando.

  4. Clique em Enviar Enviar.

As seções a seguir mostram exemplos de tarefas que você pode realizar com o Gemini Cloud Assist, além de comandos de exemplo.

Analisar jobs

Saiba mais sobre os jobs executados no seu projeto, incluindo seu histórico pessoal e do projeto, para oferecer suporte aos seguintes casos de uso:

  • Depure consultas de longa duração. Saiba mais sobre o status atual de um job e os motivos que podem estar fazendo com que ele demore mais do que o esperado, como disputa de slots, um grande número de linhas verificadas, alto volume de dados e outros. No painel do Cloud Assist, insira um comando semelhante a este:

    Por que esse job está demorando tanto? JOB_ID

  • Analise a causa de um job com falha. Saiba por que uma consulta específica falhou. No painel do Cloud Assist, insira um comando semelhante a este:

    Por que JOB_ID falhou?

  • Encontre consultas que consomem muitos recursos. Saiba mais sobre as consultas mais caras com base no número estimado de bytes processados. No painel Assistente do Cloud, insira um comando semelhante a este:

    Quais foram as três consultas mais caras que executei nos últimos dois dias?

Descobrir recursos

Pesquise e saiba mais sobre conjuntos de dados e recursos de tabela em um único projeto ou em vários. O Gemini Cloud Assist usa o Knowledge Catalog para pesquisar seus recursos do BigQuery. As pesquisas são realizadas usando suas permissões. Por exemplo, se você não tiver permissão para ver os metadados de um recurso, ele não vai aparecer nos resultados. Os casos de uso compatíveis incluem:

  • Pesquise um recurso por nome. No painel do Cloud Assist, insira um comando semelhante a este:

    Tenho algum conjunto de dados chamado "ecommerce"?

  • Pergunte sobre os metadados de uma tabela. Você pode perguntar sobre uma tabela pelo nome ou deixar o Gemini Cloud Assist inferir qual tabela você quer com base no histórico de chat ou qual tabela é referenciada na guia de consulta ativa. Se você especificar uma tabela pelo nome, use o nome totalmente qualificado. É possível perguntar sobre o esquema de uma tabela ou outros metadados, como particionamento e clustering. No painel Cloud Assist, insira um comando semelhante a este:

    Qual é o esquema de PROJECT_NAME.DATASET_NAME.TABLE_NAME?

  • Pergunte onde encontrar informações específicas. No painel do Cloud Assist, insira um comando semelhante a este:

    Onde posso encontrar informações demográficas, como idade e local, dos novos usuários do ano passado?

Analisar a linhagem de dados com o Gemini Cloud Assist

Você pode usar o Gemini Cloud Assist para analisar a linhagem de dados. Ele ajuda a entender dependências de dados, avaliar o impacto de mudanças estruturais e resumir fluxos de dados complexos. Para analisar a linhagem, você pode fazer perguntas ao Gemini Cloud Assist nas seguintes áreas funcionais:

  • Receber estatísticas de linhagem. Peça ao Gemini Cloud Assist dados quantitativos sobre um gráfico de linhagem, como o número total de recursos, conjuntos de dados ou projetos envolvidos. No painel do Cloud Assist, insira um comando semelhante a este:

    • Quantos recursos upstream o Customer_Master tem?
    • Quantos conjuntos de dados do BigQuery estão envolvidos na linhagem upstream de Customer_Interaction_Summary?
    • Forneça uma contagem de todos os recursos exclusivos no gráfico upstream de Marketing_Interaction.
  • Analisar dependências imediatas: identifique os pais diretos (origens) ou filhos diretos (consumidores) de um recurso específico analisando relações de um salto. No painel Cloud Assist, insira um comando semelhante ao seguinte:

    • Quais são as fontes imediatas de Customer_Master?
    • Quais são os consumidores diretos da tabela Card_Master?
    • Quais são as fontes diretas de Web_Session_Validated?
  • Avalie o impacto downstream. Entenda as consequências de modificar ou descartar um recurso. É possível definir o escopo dessas solicitações por profundidade (número de hops) ou limites específicos do projeto. No painel do Cloud Assist, insira um comando semelhante a este:

    • Quais recursos serão afetados se eu remover Customer_Master?
    • Mostre os recursos downstream de Customer_Master em até duas transmissões.
    • Mudar o Customer_Master vai afetar algum recurso no projeto "data-lineage-manual-tests"?
  • Identifique origens raiz e destinos finais. Encontre as origens ou destinos finais dos seus dados, ignorando as etapas intermediárias de transformação. No painel Assistente do Cloud, insira um comando semelhante a este:

    • Quais são todas as fontes finais de dados para Customer_Master?
    • Quais são as fontes de dados originais de "Transaction_Data_Enriched", excluindo tabelas intermediárias?
    • Quais são os destinos finais dos dados de "Card_Data_Validated"?
  • Rastrear o fluxo de dados entre recursos. Peça ao Gemini Cloud Assist para explicar a conexão, o caminho ou o fluxo de dados específico entre dois recursos conhecidos. No painel do Cloud Assist, insira um comando semelhante a este:

    • Como o Customer_Master depende do Customer_Data_Raw?
    • Como o fluxo de dados flui de Customer_Data_Raw para Customer_Profile_Snapshot?
    • Quantos saltos há entre "Customer_Data_Raw" e "Alert_Fact"?
  • Filtre a linhagem por tipo ou nome de recurso. Pesquise tipos específicos de recursos conectados (como visualizações do BigQuery ou painéis do Looker) ou recursos que correspondam a um padrão de nomenclatura específico. No painel do Cloud Assist, insira um comando semelhante a este:

    • O Customer_Master é usado em alguma visualização do BigQuery?
    • Há painéis do Looker downstream de Customer_Master?
    • Quais tabelas upstream de Customer_Master têm "Country" no nome?
  • Resumir gráficos de linhagem. Peça uma visão geral em linguagem natural da linhagem de um recurso, em vez de uma lista ou contagem específica. No painel do Cloud Assist, insira um comando semelhante a este:

    • Resuma os recursos que dependem de Web_Session_Validated.
    • Resuma a linhagem downstream desta tabela.
    • Qual é a linhagem de bigquery:PROJECT_NAME.DATASET_NAME?

Gerar SQL

Gere uma consulta SQL descrevendo o que você quer que ela faça. Para ter os melhores resultados, inclua o nome da tabela que você quer consultar. Por exemplo, no painel do Cloud Assist, insira um comando semelhante a este:

Gere uma consulta SQL para mostrar a duração e o tipo de assinante das dez viagens mais longas. Use a tabela bigquery-public-data.san_francisco_bikeshare.bikeshare_trips.

Gerar código Python

Gere código Python descrevendo o que você quer que ele faça. Por exemplo, no painel Cloud Assist, insira o seguinte comando para pedir ao Gemini que consulte a tabela penguins de um conjunto de dados público usando a sintaxe de comandos mágicos do BigQuery:

Gere código Python para consultar a tabela bigquery-public-data.ml_datasets.penguins usando comandos mágicos do BigQuery.

Programar uma consulta

Programe uma consulta fornecendo os seguintes detalhes no comando:

  • Programação, como todas as segundas-feiras às 17h ou todas as terças-feiras às 2h
  • Nome de exibição
  • ID da tabela de destino e ID do conjunto de dados de destino
  • Horário de início
  • Horário de término
  • Disposição de gravação, como WRITE_EMPTY, WRITE_APPEND ou WRITE_TRUNCATE

Por exemplo, no painel do Cloud Assist, você pode inserir um comando semelhante a este:

Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.

A seguir