Carga y consulta datos

Comienza a usar BigQuery creando un conjunto de datos, cargando datos en una tabla y consultando la tabla.


Para seguir la guía paso a paso sobre esta tarea directamente en la consola Google Cloud , haz clic en Guiarme:

GUIARME


Antes de comenzar

Para explorar BigQuery, primero debes acceder a laGoogle Cloud consola y crear un proyecto. Si no habilitas la facturación en tu proyecto, todos los datos que subas estarán en la zona de pruebas de BigQuery. Esta zona de pruebas te permite aprender a usar BigQuery sin cargo mientras trabajas con un conjunto limitado de funciones de BigQuery. Para obtener más información, consulta Habilita la zona de pruebas de BigQuery.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  4. Opcional: Si seleccionas un proyecto existente, asegúrate de habilitar la API de BigQuery. La API de BigQuery se habilita de forma automática en proyectos nuevos.
  5. Crea un conjunto de datos de BigQuery

    Usa la consola de Google Cloud para crear un conjunto de datos que almacene los datos. Crearás tu conjunto de datos en la ubicación multirregional de EE.UU. Para obtener información sobre las regiones y multirregiones de BigQuery, consulta Ubicaciones.

    1. En la consola de Google Cloud , abre la página de BigQuery.
    2. Ir a BigQuery
    3. En el panel de la izquierda, haz clic en Explorar.
    4. En el panel Explorador, selecciona el nombre de tu proyecto.
    5. Haz clic en Ver acciones.
    6. Seleccione Crear conjunto de datos.
    7. En la página Crear conjunto de datos, haz lo siguiente:
      1. En ID del conjunto de datos, ingresa babynames.
      2. En Tipo de ubicación, selecciona Multirregión y, luego, elige EE.UU. (varias regiones en Estados Unidos). Los conjuntos de datos públicos se almacenan en la ubicación multirregión de us. Para que sea más simple, almacena tu conjunto de datos en la misma ubicación.
      3. Deja los parámetros de configuración predeterminados restantes como están y haz clic en Crear conjunto de datos.

    Descarga el archivo que contiene los datos de origen

    El archivo que descargarás contiene alrededor de 7 MB de datos sobre nombres populares de bebés. Lo proporciona la Administración del Seguro Social de EE.UU.

    Para obtener más información sobre los datos, consulta la información general sobre nombres populares de la Administración del Seguro Social.

    1. Descarga los datos de la Administración de Seguridad Social de EE.UU. Para ello, abre la siguiente URL en una nueva pestaña del navegador:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. Extrae el archivo.

      Para obtener más información sobre el esquema del conjunto de datos, consulta el archivo NationalReadMe.pdf del archivo ZIP.

    3. Para ver cómo son los datos, abre el archivo yob2024.txt. Contiene valores separados por comas de nombre, genero asignado al nacer y la cantidad de niños con ese nombre. El archivo no tiene una fila de encabezado.

    4. Ten en cuenta la ubicación del archivo yob2024.txt para poder encontrarlo más tarde.

    Carga datos en una tabla

    A continuación, carga los datos en una tabla nueva.

    1. En el panel de la izquierda, haz clic en Explorar.
    2. En el panel Explorador, expande el nombre de tu proyecto.
    3. Haz clic en Conjuntos de datos y, luego, junto al conjunto de datos babynames, haz clic en Ver acciones y selecciona Abrir.
    4. Haz clic en Crear tabla.

      A menos que se indique lo contrario, usa los valores predeterminados para todas las opciones de configuración.

    5. En la página Crear tabla, haz lo siguiente:
      1. En la sección Fuente, en Crear tabla desde, elige Subir en la lista.
      2. En el campo Seleccionar archivo, haz clic en Explorar.
      3. Navega hasta tu archivo yob2024.txt local, ábrelo y haz clic en Abrir.
      4. En la lista Formato de archivo, elige CSV.
      5. En la sección Destino, en el campo Tabla, ingresa names_2024.
      6. En la sección Esquema, haz clic en el botón de activación Editar como texto y pega la siguiente definición de esquema en el campo de texto:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. Haz clic en Crear tabla.

        Espera a que BigQuery cree la tabla y carga los datos.

    Obtén una vista previa de los datos en la tabla

    Para obtener una vista previa de los datos de la tabla, sigue estos pasos:

    1. En el panel de la izquierda, haz clic en Explorar.
    2. En el panel Explorador, expande tu proyecto y haz clic en Conjuntos de datos.
    3. Haz clic en el conjunto de datos babynames y, luego, selecciona la tabla names_2024.
    4. Haz clic en la pestaña Vista previa. BigQuery muestra las primeras filas de la tabla.
    5. Es la pestaña de vista previa de la tabla.
    La pestaña Vista previa no está disponible para todos los tipos de tablas. Por ejemplo, la etiqueta Vista previa no se muestra para vistas o tablas externas.

    Consultar datos de tablas

    A continuación, consulta la tabla.

    1. Junto a la pestaña names_2024, haz clic en la opción Consulta en SQL. Se abrirá una pestaña nueva del editor.
    2. En el editor de consultas, pega la siguiente consulta, Esta consulta recupera los cinco nombres más populares de bebés nacidos en EE.UU. a los que se les asignó el sexo masculino cuando nacieron, en el 2024.
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. Haz clic en Ejecutar. Los resultados se muestran en la sección Resultados de la consulta.
      El panel de resultados de la búsqueda

    Consultaste con éxito una tabla en un conjunto de datos públicos y, luego, cargaste tus datos de muestra en BigQuery a través de la consola de Google Cloud .

    Limpia

    Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

    1. En la consola de Google Cloud , abre la página de BigQuery.
    2. Ir a BigQuery
    3. En el panel de la izquierda, haz clic en Explorar.
    4. En el panel Explorador, haz clic en Conjuntos de datos y, luego, en el conjunto de datos babynames que creaste.
    5. Expande la opción Ver acciones y haz clic en Borrar.
    6. En el cuadro de diálogo Borrar conjunto de datos, confirma el comando de eliminación: escribe la palabra delete y, luego, haz clic en Borrar.

    ¿Qué sigue?