Use células SQL
Este guia descreve como usar células SQL para consultar dados a partir de um bloco de notas do Colab Enterprise.
Vista geral
Uma célula SQL é uma célula de código para escrever, editar e executar consultas SQL a partir do seu bloco de notas do Colab Enterprise. As células SQL oferecem um fluxo de trabalho alternativo aos IPython Magics para o BigQuery.
Capacidades
As células SQL oferecem as seguintes capacidades:
- Suporte de teste de execução: validação da declaração SQL e uma aproximação do número de bytes processados pela consulta
- Formatação: análise de palavras-chave e realce de sintaxe
- Nomenclatura das variáveis de saída do DataFrame do BigQuery: consulte a variável de saída a partir de outras células do bloco de notas
- Substituição de variáveis: consulte as variáveis Python e as células SQL para suportar a parametrização e a capacidade de consultar os resultados de uma consulta anterior
- Visualizador do conjunto de resultados: visualizador do conjunto de resultados tabular simples com paginação para conjuntos de resultados grandes
Dialeto de SQL e origem de dados compatíveis
As células SQL do Colab Enterprise suportam o GoogleSQL.
Pode executar consultas SQL em dados do BigQuery.
Limitações
Considere as seguintes limitações quando planear o seu projeto:
- Pode executar várias declarações SQL numa única célula SQL, mas apenas os resultados da última declaração SQL são guardados num DataFrame.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Compute Engine, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Utilizador do BigQuery (
roles/bigquery.user
) -
Utilizador do Colab Enterprise (
roles/aiplatform.colabEnterpriseUser
) -
Na Google Cloud consola, aceda à página Os meus blocos de notas do Colab Enterprise.
-
No menu Região, selecione a região que contém o seu bloco de notas.
-
Clique no bloco de notas que quer abrir. Se ainda não criou um bloco de notas, crie um bloco de notas.
-
Na barra de ferramentas, para adicionar uma célula SQL, clique no menu
Opções de inserção de células de código e selecione Adicionar célula SQL.A célula SQL é adicionada ao seu bloco de notas.
-
Na célula SQL, introduza uma consulta SQL. Para uma vista geral das declarações e dos dialetos de SQL suportados, consulte o artigo Introdução ao SQL no BigQuery.
Pode fazer referência a variáveis Python em expressões colocando o nome da variável entre chavetas (
{ }
). Por exemplo, se especificou um valor numa variável Python denominadamy_threshold
, pode limitar o conjunto de resultados com uma consulta semelhante à seguinte:SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
-
Mantenha o ponteiro sobre a célula SQL que quer executar e, de seguida, clique no botão
Executar célula.
Funções necessárias
Para obter as autorizações de que precisa para criar um bloco de notas do Colab Enterprise, executar o código do bloco de notas num tempo de execução e usar dados do BigQuery no bloco de notas, peça ao seu administrador para lhe conceder as seguintes funções de IAM no projeto:
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Crie uma célula SQL
Para criar uma célula SQL no Colab Enterprise, faça o seguinte:
Introduza e execute uma consulta
O resultado da consulta é guardado automaticamente como um DataFrame do BigQuery com o mesmo nome que o título da célula SQL.
Interaja com o conjunto de resultados
Pode interagir com o conjunto de resultados como um DataFrame do BigQuery ou um DataFrame do pandas.
Pode encadear declarações SQL usando o mesmo nome de variável de célula SQL. Por exemplo, pode usar DataFrames do BigQuery gerados pelo conjunto de resultados como tabelas numa consulta seguinte, incluindo o nome do DataFrame entre chavetas ({ }
). Consulte o exemplo seguinte, que faz referência ao resultado de uma consulta anterior que foi guardado como um DataFrame denominado df
:
SELECT * FROM {df};