Cargar y consultar datos

Empieza a usar BigQuery creando un conjunto de datos, cargando datos en una tabla y consultando la tabla.


Para seguir las instrucciones paso a paso de esta tarea directamente en la Google Cloud consola, haz clic en Ayúdame:

Guíame


Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Si vas a usar un proyecto que ya tengas para seguir esta guía, comprueba que tienes los permisos necesarios para completar la guía. Si has creado un proyecto, ya tienes los permisos necesarios.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Si vas a usar un proyecto que ya tengas para seguir esta guía, comprueba que tienes los permisos necesarios para completar la guía. Si has creado un proyecto, ya tienes los permisos necesarios.

  6. Enable the BigQuery API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

    En los proyectos nuevos, la API de BigQuery se habilita automáticamente.

  7. Opcional: Habilita la facturación del proyecto. Si no quieres habilitar la facturación ni proporcionar una tarjeta de crédito, puedes seguir los pasos que se indican en este documento. BigQuery te ofrece un entorno aislado para llevar a cabo los pasos. Para obtener más información, consulta Habilitar el entorno aislado de BigQuery.
  8. Roles obligatorios

    Para obtener los permisos que necesitas para crear un conjunto de datos, crear una tabla, cargar datos y consultar datos, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en el proyecto:

    Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.

    También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.

    Crear un conjunto de datos de BigQuery

    Usa la Google Cloud consola para crear un conjunto de datos en el que almacenar los datos. Crea el conjunto de datos en la multirregión de EE. UU. Para obtener información sobre las regiones y multirregiones de BigQuery, consulta Ubicaciones.

    1. En la Google Cloud consola, abre la página BigQuery.
    2. Ir a BigQuery
    3. En el panel de la izquierda, haz clic en Explorador.
    4. En el panel Explorador, haz clic en el nombre de tu proyecto.
    5. Haz clic en Ver acciones.
    6. Selecciona Crear conjunto de datos.
    7. En la página Crear conjunto de datos, haz lo siguiente:
      1. En ID del conjunto de datos, introduce babynames.
      2. En Tipo de ubicación, selecciona Multirregión y, a continuación, elige EE. UU. (varias regiones de Estados Unidos). Los conjuntos de datos públicos se almacenan en la usubicación multirregional. Para simplificar el proceso, guarda el conjunto de datos en la misma ubicación.
      3. Deje el resto de los ajustes predeterminados como están y haga clic en Crear conjunto de datos.

    Descargar el archivo que contiene los datos de origen

    El archivo que vas a descargar contiene aproximadamente 7 MB de datos sobre nombres de bebés populares. La proporciona la Administración de la Seguridad Social de EE. UU.

    Para obtener más información sobre los datos, consulta el artículo Información general sobre nombres populares de la Administración de la Seguridad Social.

    1. Descarga los datos de la Administración de la Seguridad Social de EE. UU. abriendo la siguiente URL en una nueva pestaña del navegador:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. Extrae el archivo.

      Para obtener más información sobre el esquema del conjunto de datos, consulta el archivo NationalReadMe.pdf del archivo ZIP.

    3. Para ver el aspecto de los datos, abre el archivo yob2024.txt. Este archivo contiene valores separados por comas para el nombre, el sexo asignado al nacer y el número de niños con ese nombre. El archivo no contiene ninguna fila de cabecera.

    4. Anota la ubicación del archivo yob2024.txt para poder encontrarlo más adelante.

    Cargar datos en una tabla

    A continuación, carga los datos en una tabla nueva.

    1. En el panel de la izquierda, haz clic en Explorador.
    2. En el panel Explorador, despliega el nombre de tu proyecto.
    3. Haz clic en Conjuntos de datos y, a continuación, junto al conjunto de datos babynames, haz clic en Ver acciones y selecciona Abrir.
    4. Haz clic en Crear tabla.

      A menos que se indique lo contrario, usa los valores predeterminados de todos los ajustes.

    5. En la página Crear tabla, haz lo siguiente:
      1. En la sección Fuente, en Crear tabla a partir de, selecciona Subir en la lista.
      2. En el campo Seleccionar archivo, haz clic en Examinar.
      3. Ve al archivo yob2024.txt local, ábrelo y haz clic en Abrir.
      4. En la lista Formato de archivo, elige CSV.
      5. En la sección Destino, en el campo Tabla, introduce names_2024.
      6. En la sección Schema (Esquema), haz clic en el botón Editar como texto y pega la siguiente definición de esquema en el campo de texto:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. Haz clic en Crear tabla.

        Espera a que BigQuery cree la tabla y cargue los datos.

    Vista previa de los datos de la tabla

    Para obtener una vista previa de los datos de la tabla, sigue estos pasos:

    1. En el panel de la izquierda, haz clic en Explorador.
    2. En el panel Explorador, despliega tu proyecto y haz clic en Conjuntos de datos.
    3. Haga clic en el conjunto de datos babynames y, a continuación, seleccione la tabla names_2024.
    4. Haga clic en la pestaña Vista previa. BigQuery muestra las primeras filas de la tabla.
    5. La pestaña de vista previa de la tabla.
    La pestaña Vista previa no está disponible para todos los tipos de tabla. Por ejemplo, la pestaña Vista previa no se muestra en las tablas ni en las vistas externas.

    Consultar datos de tablas

    A continuación, consulta la tabla.

    1. Junto a la pestaña names_2024, haz clic en opción Consulta de SQL. Se abrirá una nueva pestaña del editor.
    2. En el editor de consultas, pega la siguiente consulta. Esta consulta obtiene los cinco nombres más populares de bebés nacidos en Estados Unidos en el 2024 a los que se les asignó el sexo masculino al nacer.
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. Haz clic en Ejecutar. Los resultados se muestran en la sección Resultados de la consulta.
      Panel de resultados de la consulta

    Has consultado correctamente una tabla de un conjunto de datos público y, a continuación, has cargado tus datos de muestra en BigQuery mediante la Google Cloud consola.

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    1. En la Google Cloud consola, abre la página de BigQuery.
    2. Ir a BigQuery
    3. En el panel de la izquierda, haga clic en Explorador.
    4. En el panel Explorador, haga clic en Conjuntos de datos y, a continuación, en el conjunto de datos babynames que ha creado.
    5. Abre la opción Ver acciones y haz clic en Eliminar.
    6. En el cuadro de diálogo Eliminar conjunto de datos, confirma el comando de eliminación: escribe la palabra delete y, a continuación, haz clic en Eliminar.

    Siguientes pasos