Charger et interroger des données

Découvrez BigQuery en créant un ensemble de données, en chargeant des données dans une table et en interrogeant la table.


Pour obtenir des instructions détaillées sur cette tâche directement dans la Google Cloud console, cliquez sur Visite guidée:

Visite guidée


Avant de commencer

  1. Connectez-vous à votre Google Cloud compte. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $de crédits sans frais pour exécuter, tester et déployer des charges de travail.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  6. Activez l'API BigQuery.

    Rôles requis pour activer les API

    Pour activer les API, vous avez besoin du rôle IAM Administrateur d'utilisation du service (roles/serviceusage.serviceUsageAdmin), qui contient l'autorisation serviceusage.services.enable. Découvrez comment attribuer des rôles.

    Activer l'API

    Pour les nouveaux projets, l'API BigQuery est automatiquement activée.

  7. Facultatif : Activez la facturation pour le projet. Les étapes décrites dans ce document demeurent valables, même si vous ne souhaitez pas activer la facturation ou fournir une carte de crédit. BigQuery fournit un bac à sable permettant d'accomplir les étapes. Pour en savoir plus, consultez la page Activer le bac à sable BigQuery.

Rôles requis

Pour obtenir les autorisations nécessaires pour créer un ensemble de données, créer une table, charger des données et interroger des données, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Créer un ensemble de données BigQuery

Vous pouvez créer un ensemble de données permettant de stocker les données à l'aide de la console Google Cloud . Vous créez votre ensemble de données dans l'emplacement multirégional US. Pour en savoir plus sur les régions et les emplacements multirégionaux BigQuery, consultez Emplacements.

  1. Dans la Google Cloud console, ouvrez la page "BigQuery" .
  2. Accéder à BigQuery
  3. Dans le volet de gauche, cliquez sur Explorateur.
  4. Dans le Explorateur volet, cliquez sur le nom de votre projet.
  5. Cliquez sur Afficher les actions.
  6. Sélectionnez Create Dataset (Créer un ensemble de données).
  7. Sur la page Créer un ensemble de données, procédez comme suit :
    1. Dans le champ ID de l'ensemble de données, saisissez babynames.
    2. Pour Type d'emplacement, sélectionnez Multirégional, puis choisissez US (plusieurs régions aux États-Unis). Les ensembles de données publics sont stockés dans l'emplacement multirégional us. Par souci de simplicité, stockez votre ensemble de données dans le même emplacement.
    3. Conservez les autres paramètres par défaut, puis cliquez sur Créer un ensemble de données.

Télécharger le fichier contenant les données sources

Le fichier que vous téléchargez contient environ 7 Mo de données correspondant aux prénoms populaires donnés aux bébés. Il provient de l'Administration de la sécurité sociale des États-Unis.

Pour en savoir plus sur les données, consultez les informations générales sur les prénoms populaires de l'Administration de la sécurité sociale.

  1. Téléchargez les données de l'Administration de la sécurité sociale des États-Unis en ouvrant l'URL suivante dans un nouvel onglet du navigateur :

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Extrayez le fichier.

    Pour en savoir plus sur le schéma de l'ensemble de données, consultez le fichier NationalReadMe.pdf du fichier ZIP.

  3. Pour voir à quoi ressemblent les données, ouvrez le fichier yob2024.txt. Ce fichier contient des valeurs séparées par une virgule spécifiant le prénom, le genre attribué à la naissance et le nombre d'enfants portant ce prénom. Le fichier ne comporte pas de ligne d'en-tête.

  4. Notez l'emplacement du fichier yob2024.txt pour pouvoir le retrouver ultérieurement.

Charger des données dans une table

Ensuite, chargez les données dans une table.

  1. Dans le volet de gauche, cliquez sur Explorateur.
  2. Dans le Explorateur volet, développez le nom de votre projet.
  3. Cliquez sur Ensembles de données , puis, à côté de l'ensemble de données babynames , cliquez sur Afficher les actions et sélectionnez Ouvrir.
  4. Cliquez sur Créer une table.

    Sauf indication contraire, utilisez les valeurs par défaut pour tous les paramètres.

  5. Sur la page Créer une table, procédez comme suit :
    1. Dans la section Source, sous Créer une table à partir de, sélectionnez Importer dans la liste.
    2. Dans le champ Sélectionner un fichier, cliquez sur Parcourir.
    3. Accédez à votre fichier yob2024.txt local et sélectionnez-le, puis cliquez sur Ouvrir.
    4. Dans la liste Format de fichier, sélectionnez CSV.
    5. Dans la section Destination, saisissez names_2024 dans le champ Table.
    6. Dans la section Schéma, cliquez sur le bouton Modifier sous forme de texte et collez la définition de schéma suivante dans le champ de texte :
    7. name:string,assigned_sex_at_birth:string,count:integer
    8. Cliquez sur Créer une table.

      Attendez que BigQuery crée la table et charge les données.

Prévisualiser les données de la table

Pour prévisualiser les données de la table, procédez comme suit :

  1. Dans le volet de gauche, cliquez sur Explorateur.
  2. Dans le volet Explorateur, développez votre projet et cliquez sur Ensembles de données.
  3. Cliquez sur l'ensemble de données babynames, puis sélectionnez la table names_2024.
  4. Cliquez sur l'onglet Aperçu. BigQuery affiche les premières lignes de la table.
  5. Onglet d'aperçu du tableau.
L'onglet Aperçu n'est pas disponible pour tous les types de table. Par exemple, l'onglet Aperçu n'est pas affiché pour les tables ou les vues externes.

Interroger les données de la table

Vous allez maintenant interroger la table.

  1. À côté de l'onglet names_2024, cliquez sur l'option Requête SQL. Un nouvel onglet de l'éditeur s'ouvre.
  2. Dans l'éditeur de requête, collez la requête suivante. Cette requête permet de récupérer les cinq premiers prénoms donnés aux bébés qui ont été désignés hommes à la naissance aux États-Unis en 2024.
    
      SELECT
        name,
        count
      FROM
        `babynames.names_2024`
      WHERE
        assigned_sex_at_birth = 'M'
      ORDER BY
        count DESC
      LIMIT
        5;
      
  3. Cliquez sur Exécuter. Les résultats sont affichés dans la section Résultats de la requête.
    Panneau des résultats de la requête

Vous avez interrogé une table dans un ensemble de données public, puis chargé vos exemples de données dans BigQuery à l'aide de la Google Cloud console.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans cette démonstration soient facturées sur votre Google Cloud compte pour les ressources utilisées sur cette page, procédez comme suit :

  1. Dans la Google Cloud console, ouvrez la page "BigQuery".
  2. Accéder à BigQuery
  3. Dans le volet de gauche, cliquez sur Explorateur.
  4. Dans le volet Explorateur, cliquez sur Ensembles de données, puis sur l'ensemble de données babynames que vous avez créé.
  5. Développez l'option Afficher les actions , puis cliquez sur Supprimer.
  6. Dans la boîte de dialogue Supprimer l'ensemble de données, confirmez la commande de suppression en saisissant le mot delete avant de cliquer sur Supprimer.

Étape suivante