Menghubungkan ke Google BigQuery

deskripsi: Pelajari cara menghubungkan Data Studio ke BigQuery untuk mengakses dan memvisualisasikan data dari tabel, tampilan, atau kueri SQL kustom BigQuery.

BigQuery adalah data warehouse analisis berharga terjangkau yang terkelola sepenuhnya dan berskala petabyte dari Google. Konektor BigQuery Data Studio memungkinkan Anda mengakses data dari tabel BigQuery di dalam Data Studio.

Sebelum memulai

Untuk mengakses data BigQuery di Data Studio, Anda harus menyediakan akun Penagihan Google Cloud. BigQuery adalah produk berbayar dan Anda mungkin dikenai biaya penggunaan BigQuery saat mengakses BigQuery melalui Data Studio. Pelajari lebih lanjut harga BigQuery.

Cara menghubungkan ke BigQuery

Anda dapat menghubungkan Data Studio ke tabel, tampilan, atau kueri kustom di Google BigQuery.

Langkah-langkah untuk menghubungkan

  1. Login ke Data Studio.

  2. Klik Buat, lalu pilih Laporan.

  3. Editor laporan muncul dan panel Tambahkan data ke laporan akan terbuka.

  4. Untuk membuat sumber data tersemat baru, pilih konektor BigQuery.

    1. Untuk memilih sumber data lama yang dapat digunakan kembali, klik tab Sumber data saya, lalu pilih sumber data dari jenis apa pun yang telah Anda buat sebelumnya atau yang telah dibagikan kepada Anda.
  5. Konfigurasi koneksi sumber data ke data BigQuery Anda. Anda dapat terhubung ke tabel atau tampilan BigQuery, atau terhubung menggunakan kueri SQL kustom.

  6. Klik Tambahkan.

Dalam beberapa saat, tabel yang terhubung ke sumber data akan muncul di kanvas laporan.

Penjelasan tentang sumber data yang tersemat versus sumber data yang dapat digunakan kembali

Sumber data dapat berupa sumber data sematan atau dapat digunakan kembali. Laporan dapat menyertakan sumber data sematan dan sumber data yang dapat digunakan kembali.

Sumber data yang Anda buat saat mengedit laporan akan disematkan di laporan. Anda dapat mengedit sumber data sematan langsung di dalam laporan tersebut. Sumber data sematan mempermudah kolaborasi dalam laporan dan sumber data. Siapa pun yang dapat mengedit laporan juga dapat mengedit sumber data, serta mengubah koneksinya. Saat Anda membagikan atau menyalin laporan tersebut, sumber data sematan juga dibagikan atau disalin.

Sumber data yang Anda buat dari halaman beranda dapat digunakan kembali. Anda dapat menggunakan kembali sumber data ini di laporan lain. Dengan sumber data yang dapat digunakan kembali, Anda dapat membuat dan membagikan model data yang konsisten di seluruh organisasi. Hanya orang-orang yang Anda ajak berbagi sumber data yang dapat digunakan kembali tersebut yang dapat mengeditnya. Hanya pemilik kredensial sumber data yang dapat mengubah koneksi.

Pelajari lebih lanjut sumber data.

Baru menggunakan Data Studio?

Gunakan panel properti untuk mengubah data dan gaya tabel. Gunakan toolbar untuk menambahkan lebih banyak diagram, kontrol, dan komponen lainnya ke laporan Anda.

Mengenal Data Studio

Menghubungkan ke tabel atau tampilan BigQuery

Tabel BigQuery berisi kumpulan data individual yang diatur dalam bentuk baris. Setiap catatan terdiri dari kolom (juga disebut field). Tampilan BigQuery adalah tabel virtual yang ditentukan oleh kueri SQL yang dijalankan di konsol BigQuery.

Untuk terhubung ke tabel atau tampilan, Anda harus memberikan informasi berikut:

  • Project BigQuery
  • Set data
  • Tabel atau tampilan

Project

Project mengatur resource BigQuery dan memberikan informasi yang diperlukan untuk penagihan jika laporan Anda melampaui kuota gratis BigQuery. Anda dapat menggunakan project yang sama untuk penagihan dan pengelolaan data, atau menggunakan satu project untuk data dan project lain untuk penagihan. Pelajari lebih lanjut Project Google Cloud.

Pilih salah satu opsi berikut untuk memilih project Anda:

  • PROJECT TERBARU
  • PROJECT SAYA
  • PROJECT BERSAMA

Project terbaru

Opsi PROJECT TERBARU menampilkan project yang baru-baru ini Anda akses di konsol Google Cloud . Anda juga dapat memasukkan project ID secara manual. Project yang Anda pilih digunakan untuk penagihan dan akses data. Setelah memilih project, pilih set data.

Project saya

Opsi PROJECT SAYA memungkinkan Anda memilih project yang Anda miliki aksesnya. Anda juga dapat memasukkan project ID secara manual. Project yang Anda pilih digunakan untuk penagihan dan akses data. Setelah memilih project, pilih set data.

Jika Anda memiliki akses ke banyak project, kemungkinan tidak semua project tersebut muncul dalam daftar. Jika daftar melebihi jumlah item maksimum, Anda dapat memasukkan project yang tidak tercantum secara langsung dengan mengetiknya di kolom entri.

Project bersama

Opsi PROJECT BERSAMA memungkinkan Anda mengakses project yang telah dibagikan kepada Anda. Anda dapat memilih project yang berbeda untuk data dan penagihan.

Set data

Set data digunakan untuk mengatur dan mengontrol akses ke data Anda. Pilih set data dari daftar, atau telusuri set data berdasarkan nama.

Set data publik

Set data publik BigQuery adalah sampel publik, tempat set data dibagikan, tetapi bukan project-nya. Untuk membuat kueri ke data ini, Anda harus menentukan project penagihan Anda sendiri, yang akan digunakan untuk menagihkan biaya pemrosesan pada data bersama.

Tabel

Anda dapat menghubungkan sumber data Data Studio ke satu tabel atau tampilan.

Terhubung ke tabel berpartisi menurut tanggal

Data Studio dapat memanfaatkan tabel berpartisi menurut tanggal di BigQuery. Saat Anda terhubung ke tabel yang dipartisi pada kolom DATE, DATETIME, atau TIMESTAMP, Data Studio dapat menggunakan kolom tersebut sebagai dimensi rentang tanggal untuk diagram yang didasarkan pada sumber data ini.

Pelajari lebih lanjut cara menghubungkan Data Studio ke tabel berpartisi menurut tanggal di BigQuery.

Terhubung ke BigQuery menggunakan kueri SQL kustom

Opsi KUERI KUSTOM memungkinkan Anda terhubung ke data dengan menulis SQL. Sintaksis kueri kustom mengikuti Dialek SQL standar. Untuk menggunakan dialek SQL BigQuery lama, pilih opsi Gunakan Legacy SQL.

Gunakan antarmuka pengguna BigQuery untuk membuat dan menguji kueri, lalu salin dan tempel kueri tersebut ke kotak kueri kustom Data Studio.

Project penagihan

Opsi Project Penagihan memungkinkan Anda menyediakan project penagihan untuk kueri kustom dengan menelusuri atau memasukkan project ID secara manual. Jika organisasi Anda memiliki banyak project BigQuery, Anda mungkin perlu menggunakan metode entri manual untuk menemukan project.

Untuk menggunakan satu project untuk penagihan dan project lain untuk data Anda, pilih atau masukkan project penagihan di antarmuka pengguna, lalu sertakan project data dalam klausa SELECT...FROM dari kueri kustom.

Contoh konfigurasi kueri kustom BigQuery, dengan project penagihan yang ditetapkan ke Looker Studio Project, sedangkan kueri menentukan set data publik BigQuery dalam klausa FROM di kueri.

Parameter kueri

Parameter memungkinkan Anda membuat laporan yang lebih responsif dan dapat disesuaikan. Anda dapat meneruskan parameter dalam sumber data BigQuery ke kueri pokok. Untuk menggunakan parameter dalam kueri kustom, ikuti panduan sintaksis untuk menjalankan kueri berparameter di BigQuery.

Pelajari lebih lanjut cara menggunakan parameter dalam kueri kustom.

Batasan kueri kustom

Data Studio menggunakan SQL kustom Anda sebagai pernyataan SELECT internal untuk setiap kueri yang dibuat pada database. Akibatnya, kueri kustom Anda akan menghasilkan tabel virtual baru, yang kemudian akan dikueri oleh Data Studio dengan SQL "luar" yang dibuatnya sendiri. Oleh karena itu, kueri kustom di Data Studio tunduk pada batasan berikut:

Kueri SQL kustom hanya boleh memiliki satu pernyataan

Misalnya, kode berikut tidak akan berfungsi karena memiliki beberapa pernyataan SQL:


DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;

SELECT total_bytes_billed / (1024 * 1024)* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;

Menggunakan nama kolom yang tidak ambigu dalam gabungan

Kueri gabungan kustom tidak dapat menangani nama kolom duplikat. Diagram yang menggunakan sumber data berdasarkan kueri kustom yang menyertakan kolom duplikat akan menampilkan error konfigurasi pengguna yang terlihat seperti berikut ini:

Teks pesan error: Error Konfigurasi Pengguna

Guna menghindari masalah ini, pastikan untuk menggunakan nama kolom yang tidak ambigu dalam kueri kustom Anda.

Misalnya, Anda menggabungkan dua tabel dengan skema identik, yang bergabung pada kolom Criteria_ID yang ditemukan di kedua tabel.


    SELECT * FROM (
          SELECT Criteria_ID, Parent_ID, Name FROM 'table_1'
            ) As table_1
          LEFT JOIN (
            SELECT Criteria_ID, Parent_ID, Name FROM 'table_2'
            ) As table_2
          ON
            table_1.Criteria_ID = table_2.Criteria_ID

Kueri ini menyertakan nama kolom duplikat berikut:

  • Criteria_ID
  • Parent_ID
  • Name

Untuk menghindari error Field is ambiguous, Anda dapat mengganti nama kolom duplikat secara eksplisit menggunakan kata kunci AS:


    SELECT *
          FROM (
            SELECT
              Criteria_ID AS Criteria_ID_1,
              Parent_ID AS Parent_ID_1,
              Name AS NAME_1
           FROM
             'table_1' ) AS table_1
           LEFT JOIN (
             SELECT
               Criteria_ID AS Criteria_ID_2,
               Parent_ID AS Parent_ID_2,
               Name AS NAME_2
             FROM
               'table_2' ) AS table_2
             ON
               table_1.Criteria_ID_1 = table_2.Criteria_ID_2;

Jika hanya perlu mengganti nama beberapa kolom, Anda dapat memilih semuanya kecuali kolom yang ingin diganti namanya, misalnya:


SELECT * EXCEPT (city), city AS city_1 FROM 'table_1'

Waktu tunggu kueri

Kueri kustom di Data Studio mungkin akan habis waktunya setelah tiga hingga lima menit. Jika waktu tunggu kueri kustom habis, coba pendekatan berikut untuk menyelesaikan masalah tersebut:

  • Sederhanakan kueri agar berjalan lebih cepat.
  • Jalankan kueri di database Anda dan simpan hasilnya dalam tabel terpisah. Kemudian, hubungkan ke tabel tersebut di sumber data Anda.

Tabel multi-hari

BigQuery mendukung pembuatan kueri di beberapa tabel dengan setiap tabel memiliki data dari rentang waktu sehari. Tabel memiliki format YYYYMMDD. Saat Data Studio menemukan tabel yang memiliki format YYYYMMDD, tabel tersebut akan ditandai sebagai tabel multi-hari, dan hanya awalan nama_YYYYMMDD yang akan ditampilkan pada pemilihan tabel.

Saat diagram dibuat untuk memvisualisasikan tabel ini, Data Studio akan otomatis membuat rentang tanggal default, yaitu 28 hari terakhir, dan melakukan kueri terhadap 28 tabel terakhir secara tepat. Anda dapat mengonfigurasi setelan ini dengan mengedit laporan, memilih diagram, lalu menyesuaikan properti Rentang Tanggal di tab DATA pada diagram.

Melihat SQL yang dikeluarkan untuk BigQuery

Anda dapat melihat semua SQL BigQuery yang dihasilkan Data Studio dari dalam antarmuka pengguna Histori Kueri BigQuery.

Metrik Jumlah Kumpulan Data

Sumber data BigQuery secara otomatis menyediakan metrik Jumlah Kumpulan Data default. Anda dapat menggunakannya untuk memperinci dimensi agar dapat menunjukkan jumlah data yang dikumpulkan oleh diagram Anda.

Dukungan untuk Kontrol Layanan VPC

Data Studio dapat terhubung ke project BigQuery yang dilindungi oleh perimeter Kontrol Layanan VPC (VPC-SC) melalui tingkat akses berbasis IP pelihat. Konektor BigQuery meneruskan alamat IP pelihat laporan ke BigQuery, yang kemudian dapat menerapkan tingkat akses berbasis IP yang telah disiapkan.

Memvisualisasikan poligon GEOGRAPHY BigQuery

Anda dapat menampilkan Poligon GEOGRAPHY dengan menggunakan visualisasi Google Maps dalam laporan Anda. Lihat artikel Memvisualisasikan poligon GEOGRAPHY BigQuery dengan Data Studio untuk mendapatkan tutorial.

Menganalisis kueri Data Studio dengan label tugas

Semua kueri yang dikirim oleh Data Studio ke BigQuery memiliki label tugas BigQuery requestor:looker_studio. Label tugas ini dapat digunakan untuk mengidentifikasi kueri BigQuery yang terkait dengan Data Studio. Untuk mengetahui informasi selengkapnya tentang label di BigQuery, lihat halaman dokumentasi BigQuery Melihat label.

Jika Anda adalah pemilik sumber data BigQuery, Anda juga dapat melihat detail tugas dengan mengklik ikon Didukung oleh BigQuery.

Untuk mengetahui informasi selengkapnya tentang cara melacak performa dan biaya diagram serta laporan Data Studio, lihat halaman dokumentasi BigQuery Menganalisis data dengan Data Studio.

Dialog BigQuery

Jika Anda memiliki kredensial pemilik di sumber data BigQuery, Data Studio akan menampilkan ikon BigQuery di sudut kanan atas diagram yang menggunakan BigQuery. Arahkan kursor ke diagram, lalu klik ikon BigQuery untuk membuka dialog BigQuery. Dialog ini akan menampilkan link ke halaman detail tugas BigQuery. Halaman detail tugas BigQuery mencakup informasi berikut:

  • Kueri SQL untuk diagram
  • Data yang ditampilkan oleh kueri SQL
  • Perincian langkah kueri per tahap
  • Statistik kueri seperti total runtime dan slot yang digunakan

Meningkatkan performa dengan BigQuery Storage Read API

Untuk kueri yang menggunakan hasil yang di-page, mengaktifkan BigQuery Storage Read API dapat meningkatkan waktu kueri. Data Studio otomatis menggunakan Storage Read API jika hal ini meningkatkan waktu proses kueri.

Untuk mengaktifkan BigQuery Storage Read API, berikan izin berikut kepada pengguna BigQuery Anda yang terhubung ke Data Studio:

  • bigquery.readsessions.create
  • bigquery.readsessions.getData

Kuota dan batas umum

Jumlah maksimum baris yang dapat ditampilkan menggunakan Konektor BigQuery adalah 2 juta baris. Data Studio akan menunjukkan jika terdapat lebih dari 2 juta baris data, tetapi tidak akan menentukan jumlah baris.

Selain itu, sumber data BigQuery tunduk pada batas kapasitas dan batas kuota yang sama seperti BigQuery itu sendiri.

Untuk sumber data BigQuery, MEDIAN diterapkan menggunakan fungsi APPROX_QUANTILES BigQuery. Menerapkan MEDIAN ke data yang berasal dari BigQuery mungkin memberikan hasil yang sedikit berbeda daripada menerapkan MEDIAN ke data yang sama yang berasal dari jenis sumber data lain.

Konektor BigQuery tidak mendukung Kunci Enkripsi yang Dikelola Pelanggan (CMEK). Jika project Google Cloud Anda tunduk pada kebijakan organisasi yang mewajibkan CMEK, Data Studio tidak dapat membuat kueri data dan akan menampilkan error CONDITION_NOT_MET.