Memuat dan membuat kueri data

Mulai menggunakan BigQuery dengan membuat set data, memuat data ke dalam tabel, dan mengkueri tabel.


Untuk mengikuti panduan langkah demi langkah untuk tugas ini langsung di Google Cloud konsol, klik Pandu saya:

Pandu saya


Sebelum memulai

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  6. Aktifkan BigQuery API.

    Peran yang diperlukan untuk mengaktifkan API

    Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.

    Mengaktifkan API

    Untuk project baru, BigQuery API diaktifkan secara otomatis.

  7. Opsional: Aktifkan penagihan untuk project. Jika Anda tidak ingin mengaktifkan penagihan atau memberikan kartu kredit, langkah-langkah dalam dokumen ini tetap berfungsi. BigQuery menyediakan sandbox untuk melakukan langkah-langkah tersebut. Untuk mengetahui informasi selengkapnya, lihat Mengaktifkan sandbox BigQuery.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk membuat set data, membuat tabel, memuat data, dan membuat kueri data, minta administrator untuk memberi Anda peran IAM berikut pada project:

  • Menjalankan tugas pemuatan dan tugas kueri: BigQuery Job User (roles/bigquery.jobUser)
  • Buat set data, buat tabel, muat data ke dalam tabel, dan kueri tabel: Editor Data BigQuery (roles/bigquery.dataEditor)

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Membuat set data BigQuery

Gunakan konsol Google Cloud untuk membuat set data guna menyimpan data. Anda membuat set data di lokasi multi-region AS. Untuk mengetahui informasi tentang region dan multi-region BigQuery, lihat Lokasi.

  1. Di konsol Google Cloud , buka halaman BigQuery.
  2. Buka BigQuery
  3. Di panel kiri, klik Explorer.
  4. Di panel Explorer, klik nama project Anda.
  5. Klik Lihat tindakan.
  6. Pilih Buat set data.
  7. Di halaman Create dataset, lakukan hal berikut:
    1. Untuk Dataset ID, masukkan babynames.
    2. Untuk Location type, pilih Multi-region, lalu pilih US (multiple regions in United States). Set data publik disimpan di lokasi multi-region us. Agar lebih mudah, simpan set data Anda di lokasi yang sama.
    3. Jangan ubah setelan default yang tersisa, lalu klik Create dataset.

Download file yang berisi data sumber

File yang Anda download berukuran sekitar 7 MB yang berisi data tentang nama bayi populer. Ini disediakan oleh Administrasi Jaminan Sosial AS.

Untuk mengetahui informasi selengkapnya tentang data, lihat Informasi latar belakang untuk nama populer dari Administrasi Jaminan Sosial.

  1. Download data Administrasi Jaminan Sosial AS dengan membuka URL berikut di tab browser baru:

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Ekstrak file.

    Untuk informasi selengkapnya tentang skema set data, lihat file NationalReadMe.pdf file ZIP.

  3. Untuk melihat tampilan data tersebut, buka file yob2024.txt. File ini berisi nilai yang dipisahkan koma untuk nama, jenis kelamin yang ditetapkan saat lahir, dan jumlah anak dengan nama tersebut. File tidak memiliki baris header.

  4. Catat lokasi file yob2024.txt agar Anda dapat menemukannya nanti.

Memuat data ke dalam tabel

Selanjutnya, muat data ke dalam tabel baru.

  1. Di panel kiri, klik Explorer.
  2. Di panel Explorer, luaskan nama project Anda.
  3. Klik Datasets, lalu di samping set data babynames, klik View actions, lalu pilih Open.
  4. Klik Buat tabel.

    Kecuali jika dinyatakan lain, gunakan nilai default untuk semua setelan.

  5. Di halaman Create table, lakukan hal berikut:
    1. Di bagian Source, untuk Create table from, pilih Upload dari daftar.
    2. Di kolom Select file, klik Browse.
    3. Arahkan ke dan buka file yob2024.txt lokal, lalu klik Open.
    4. Dari daftar File format, pilih CSV.
    5. Di bagian Destination, di kolom Table, masukkan names_2024.
    6. Di bagian Schema, klik tombol Edit as text, lalu tempelkan definisi skema berikut ke dalam kolom teks:
    7. name:string,assigned_sex_at_birth:string,count:integer
    8. Klik Create table.

      Tunggu hingga BigQuery membuat tabel dan memuat datanya.

Pratinjau data tabel

Untuk melihat pratinjau data tabel, ikuti langkah-langkah berikut:

  1. Di panel kiri, klik Explorer.
  2. Di panel Explorer, luaskan project Anda dan klik Set Data.
  3. Klik set data babynames, lalu pilih tabel names_2024.
  4. Klik tab Pratinjau. BigQuery menampilkan beberapa baris pertama tabel.
  5. Tab pratinjau tabel.
Tab Preview hanya tersedia untuk jenis tabel tertentu. Misalnya, tab Preview tidak ditampilkan untuk tabel atau tampilan eksternal.

Membuat kueri data tabel

Selanjutnya, buat kueri tabel.

  1. Di samping tab names_2024, klik opsi SQL query. Tab editor baru akan terbuka.
  2. Di editor kueri, tempel kueri berikut. Kueri ini mengambil lima nama teratas untuk bayi yang lahir di AS yang ditetapkan sebagai laki-laki saat lahir pada tahun 2024.
    
      SELECT
        name,
        count
      FROM
        `babynames.names_2024`
      WHERE
        assigned_sex_at_birth = 'M'
      ORDER BY
        count DESC
      LIMIT
        5;
      
  3. Klik Run. Hasilnya ditampilkan di bagian Query results.
    Panel hasil kueri

Anda telah berhasil membuat kueri tabel dalam set data publik, lalu memuat data sampel ke BigQuery menggunakan konsol Google Cloud .

Pembersihan

Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.

  1. Di konsol Google Cloud , buka halaman BigQuery.
  2. Buka BigQuery
  3. Di panel kiri, klik Explorer.
  4. Di panel Explorer, klik Datasets, lalu klik set data babynames yang telah Anda buat.
  5. Luaskan opsi View actions, lalu klik Delete.
  6. Pada dialog Delete dataset, konfirmasi perintah delete: ketik kata delete, lalu klik Delete.

Langkah berikutnya