Pode explorar os resultados das consultas do BigQuery através dos blocos de notas do Colab Enterprise no BigQuery.
Neste tutorial, consulta dados de um conjunto de dados públicos do BigQuery e explora os resultados da consulta num bloco de notas.
Autorizações necessárias
Para criar e executar blocos de notas, precisa das seguintes funções de gestão de identidade e de acesso (IAM):
- Utilizador do BigQuery (
roles/bigquery.user
) - Notebook Runtime User (
roles/aiplatform.notebookRuntimeUser
) - Code Creator (
roles/dataform.codeCreator
)
Abra os resultados da consulta num bloco de notas
Pode executar uma consulta SQL e, em seguida, usar um bloco de notas para explorar os dados. Esta abordagem é útil se quiser modificar os dados no BigQuery antes de trabalhar com eles ou se precisar apenas de um subconjunto dos campos na tabela.
Na Google Cloud consola, aceda à página BigQuery.
No campo Escreva para pesquisar, introduza
bigquery-public-data
.Se o projeto não for apresentado, introduza
bigquery
no campo de pesquisa e, de seguida, clique em Pesquisar em todos os projetos para fazer corresponder a string de pesquisa aos projetos existentes.Selecione bigquery-public-data > ml_datasets > penguins.
Para a tabela penguins, clique em
Ver ações e, de seguida, em Consultar.Adicione um asterisco (
*
) para a seleção de campos à consulta gerada, de modo que seja lida como no exemplo seguinte:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Clique em
Executar.Na secção Resultados da consulta, clique em Explorar dados e, de seguida, clique em Explorar com o bloco de notas do Python.
Prepare o notebook para utilização
Prepare o bloco de notas para utilização associando-o a um tempo de execução e definindo os valores predefinidos da aplicação.
- No cabeçalho do bloco de notas, clique em Associar para associar ao tempo de execução predefinido.
- No bloco de código Setup, clique em Executar célula.
Explore os dados
- Para carregar os dados de pinguins para um BigQuery DataFrame e mostrar os resultados, clique em Executar célula no bloco de código na secção Conjunto de resultados carregado da tarefa do BigQuery como um DataFrame.
- Para obter métricas descritivas para os dados, clique em Executar célula no bloco de código na secção Mostrar estatísticas descritivas com describe().
- Opcional: use outras funções ou pacotes do Python para explorar e analisar os dados.
O exemplo de código seguinte mostra a utilização de
bigframes.pandas
para analisar dados e bigframes.ml
para criar um modelo de regressão linear a partir de dados de pinguins num
DataFrame do BigQuery: