Usar células de visualização
Este guia descreve como usar células de visualização para visualizar dados em um bloco do Colab Enterprise.
As células de visualização podem gerar visualizações interativas e editáveis com base em dados de um DataFrame no seu bloco. É possível configurar uma célula de visualização para ajudar a explorar dados e descobrir insights. As opções de configuração da célula de visualização incluem o seguinte:
- Especificar quais campos são usados na visualização.
- Selecionar um tipo de gráfico, como gráfico de dispersão ou de barras.
- Especificar como os dados são agregados.
- Mudar as cores, os rótulos e o título da visualização.
Limitações
Considere as seguintes limitações ao planejar seu projeto:
- A execução de uma célula de visualização redefine a configuração de visualização atual.
- A opção Visualizar em Próximas etapas nem sempre aparece ao trabalhar com DataFrames do pandas.
- O Gemini no Colab Enterprise não pode interagir com células de visualização. Isso significa que o Gemini não pode ler ou sugerir mudanças nas células de visualização e talvez não consiga explicar ou ajudar a corrigir erros gerados por elas.
Antes de começar
- Faça login na sua Google Cloud conta do. Se você não conhece o Google Cloud, crie uma conta para avaliar o desempenho dos nossos produtos em cenários reais. Clientes novos também recebem US $300 em créditos para executar, testar e implantar cargas de trabalho.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Funções exigidas
Para receber as permissões necessárias para criar um bloco do Colab Enterprise, executar o código do bloco em um ambiente de execução e usar dados do BigQuery no bloco, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Usuário do BigQuery (
roles/bigquery.user) -
Usuário do Colab Enterprise (
roles/aiplatform.colabEnterpriseUser)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias usando personalizados papéis ou outros predefinidos papéis.
Criar um DataFrame
Para usar uma célula de visualização, você precisa de dados armazenados em um DataFrame no seu bloco. Para criar um DataFrame, execute uma consulta SQL em uma célula SQL. Para mais informações sobre células SQL, consulte Usar células SQL.
Para executar uma consulta SQL e criar um DataFrame, faça o seguinte:
-
No Google Cloud console do, acesse a página Meus blocos do Colab Enterprise.
-
No menu Região, selecione a região que contém o notebook.
-
Clique no bloco que você quer abrir. Se você ainda não criou um bloco, crie um.
-
Na barra de ferramentas, para adicionar uma célula SQL, clique no Inserir opções de célula de código menu e selecione Adicionar célula SQL.
A célula SQL é adicionada ao seu bloco.
-
Na célula SQL, insira uma consulta SQL. Por exemplo, para consultar dados do conjunto de dados público do BigQuery sobre pinguins, insira o seguinte:
SELECT * FROM `bigquery-public-data.ml_datasets.penguins`;
-
Mantenha o ponteiro do mouse sobre a célula SQL e clique no Executar célula botão.
A saída da consulta é salva automaticamente em um DataFrame chamado df.
Criar uma visualização
Para criar uma visualização de um DataFrame no seu bloco, adicione uma célula de visualização e configure-a para usar um DataFrame específico. Ou, se uma seção Próximas etapas aparecer em um DataFrame gerado, você pode clicar no botão Visualizar com DATAFRAME_NAME.
Adicionar célula de visualização
-
Use um dos seguintes métodos para adicionar uma célula de visualização ao seu bloco:
-
Na barra de ferramentas, para adicionar uma célula de visualização, clique no Inserir opções de célula de código menu e selecione Adicionar célula de visualização.
-
Mantenha o ponteiro do mouse entre duas células no bloco para indicar onde você quer adicionar a célula de visualização e clique no Visualização botão.
Uma célula de visualização é adicionada ao seu bloco.
-
-
Na célula de visualização, para selecionar o DataFrame a ser visualizado, clique no menu Escolher um DataFrame e selecione df.
-
Mantenha o ponteiro do mouse sobre a célula de visualização e clique no botão Executar célula.
O Colab Enterprise gera uma visualização padrão. Para mudar a visualização, consulte a próxima seção.
Visualizar com o DataFrame
-
Se houver uma seção Próximas etapas em um DataFrame gerado, clique no botão Visualizar com DATAFRAME_NAME.
Uma célula de visualização é adicionada ao seu bloco. O DataFrame da célula anterior é definido automaticamente como a fonte de dados dessa célula de visualização.
-
Mantenha o ponteiro do mouse sobre a célula de visualização e clique no botão Executar célula.
O Colab Enterprise gera uma visualização padrão. Para mudar a visualização, consulte a próxima seção.
Configurar a visualização
Uma célula de visualização gera uma visualização padrão que pode ser configurada usando o painel lateral da célula. As opções de configuração variam de acordo com os dados que você está usando e o tipo de gráfico da visualização.
Para conferir as configurações de uma célula de visualização, faça o seguinte:
-
Na célula de visualização, clique no botão Dados para conferir os dados subjacentes usados na visualização.
-
Clique no botão Gráfico para voltar ao modo de gráfico e conferir a visualização.
-
Para mostrar ou ocultar as configurações, clique no botão Alternar configurações.
-
No painel de configurações, para selecionar um tipo de gráfico diferente, clique no menu de tipo de gráfico e selecione o tipo de gráfico que você quer. Alguns tipos de gráfico usam apenas um subconjunto de campos do DataFrame disponível.
-
Na guia Configuração, mude os campos usados na visualização selecionando dimensões e métricas diferentes. Geralmente, as dimensões são campos categóricos nos seus dados, e as métricas são valores numéricos.
-
Para mudar a agregação de uma métrica, clique na configuração de agregação à esquerda do nome da métrica e selecione uma agregação diferente.
-
Para mudar a métrica usada para classificação, clique na métrica Classificar, e selecione uma métrica diferente. Também é possível mudar a agregação e se os valores serão classificados em ordem decrescente ou crescente.
-
Na guia Estilo, é possível fazer mudanças no texto e na aparência da visualização, incluindo o seguinte:
- Se o título e os rótulos serão mostrados ou ocultos
- Texto do título
- Texto do rótulo do eixo
- Fonte, tamanho e cor do texto
- Cores das métricas visualizadas
Filtrar os dados na visualização
É possível filtrar os dados na visualização com base no valor de um campo. Para filtrar os dados, faça o seguinte:
-
Na parte de cima da célula de visualização, clique em Adicionar filtro.
-
Selecione um campo para filtrar os dados.
-
Para concluir a caixa de diálogo de filtro, faça uma das seguintes ações com base no tipo de dados que você está filtrando:
- Para dimensões ou dados categóricos, selecione as categorias que você quer incluir na visualização.
- Para métricas ou dados numéricos, ajuste os controles deslizantes para os valores mais baixos e mais altos que você quer incluir na visualização.
-
Clique em Aplicar.
A seguir
Saiba mais sobre o BigQuery DataFrames.
Use células SQL em um bloco do Colab Enterprise.
Use o Gemini para explicar e corrigir erros.