Visualize gráficos com os DataFrames do BigQuery
Este documento demonstra como traçar vários tipos de gráficos através da biblioteca de visualização BigQuery DataFrames.
A bigframes.pandas API
oferece um ecossistema completo de ferramentas para Python. A API suporta operações estatísticas avançadas e pode visualizar as agregações geradas a partir de DataFrames do BigQuery. Também pode mudar de
BigQuery DataFrames para um pandas DataFrame com operações de amostragem incorporadas.
Histograma
O exemplo seguinte lê dados da tabela para traçar um histograma sobre a distribuição das profundidades do bico de pinguins:bigquery-public-data.ml_datasets.penguins

Gráfico de linhas
O exemplo seguinte usa dados da tabela bigquery-public-data.noaa_gsod.gsod2021 para traçar um gráfico de linhas das alterações da temperatura mediana ao longo do ano:

Gráfico de áreas
O exemplo seguinte usa a tabela bigquery-public-data.usa_names.usa_1910_2013 para acompanhar a popularidade dos nomes na história dos EUA e foca-se nos nomes Mary, Emily e Lisa:

Gráfico de barras
O exemplo seguinte usa a tabela bigquery-public-data.ml_datasets.penguins para
visualizar a distribuição dos sexos dos pinguins:

Gráfico de dispersão
O exemplo seguinte usa a tabela bigquery-public-data.new_york_taxi_trips.tlc_yellow_trips_2021 para explorar a relação entre os valores das tarifas de táxi e as distâncias das viagens:

Visualizar um grande conjunto de dados
O BigQuery DataFrames transfere dados para o seu computador local para visualização. O número de pontos de dados a transferir está limitado a 1000 por predefinição. Se o número de pontos de dados exceder o limite máximo, os DataFrames do BigQuery usam uma amostragem aleatória do número de pontos de dados igual ao limite máximo.
Pode substituir este limite definindo o parâmetro sampling_n ao traçar um gráfico, conforme mostrado no exemplo seguinte:

Representação gráfica avançada com parâmetros pandas e Matplotlib
Pode transmitir mais parâmetros para ajustar o seu gráfico, tal como pode fazer com o pandas, porque a biblioteca de representação gráfica dos DataFrames do BigQuery é baseada no pandas e no Matplotlib. As secções seguintes descrevem exemplos.
Tendência de popularidade dos nomes com subgráficos
Usando os dados do histórico de nomes do exemplo de gráfico de área, o exemplo seguinte cria gráficos individuais para cada nome definindo subplots=True na chamada da função plot.area():

Gráfico de dispersão de viagens de táxi com várias dimensões
Usando dados do exemplo de gráfico de dispersão, o exemplo seguinte
muda o nome das etiquetas do eixo x e do eixo y, usa o parâmetro passenger_count
para os tamanhos dos pontos, usa pontos de cor com o parâmetro tip_amount
e redimensiona a figura:

O que se segue?
- Saiba como usar os DataFrames do BigQuery.
- Saiba como usar frames de dados do BigQuery no dbt.
- Explore a referência da API BigQuery DataFrames.