Apache Spark

Halaman ini berisi informasi tentang cara menghubungkan Looker ke Apache Spark 3.

Looker terhubung ke Apache Spark 3+ melalui koneksi JDBC ke Spark Thrift Server.

Mengenkripsi traffic jaringan

Praktik terbaiknya adalah mengenkripsi traffic jaringan antara aplikasi Looker dan database Anda. Pertimbangkan salah satu opsi yang dijelaskan di halaman dokumentasi Mengaktifkan akses database yang aman.

Membuat koneksi Looker ke database Anda

Di bagian Admin Looker, pilih Connections, lalu klik Add Connection.

Isi detail koneksi. Sebagian besar setelan sama untuk sebagian besar dialek database. Lihat halaman dokumentasi Menghubungkan Looker ke database Anda untuk mengetahui informasi selengkapnya. Beberapa setelan dijelaskan di bawah:

  • Nama: Nama koneksi. Nama ini akan digunakan untuk merujuk koneksi dalam model LookML.
  • Dialek: Pilih Apache Spark 3+.
  • Host: Host server Thrift.
  • Port Port server Thrift (10000 secara default).
  • Database: Skema/database default yang akan dimodelkan. Jika tidak ada database yang ditentukan untuk tabel, database ini akan diasumsikan.
  • Nama Pengguna: Pengguna yang akan diautentikasi oleh Looker.
  • Sandi: Sandi opsional untuk pengguna Looker.
  • Aktifkan PDT: Gunakan tombol ini untuk mengaktifkan tabel turunan persisten. Jika PDT diaktifkan, jendela Connection akan menampilkan setelan PDT tambahan dan bagian PDT Overrides.
  • Temp Database: Skema/database sementara untuk menyimpan PDT. Skema/database ini harus dibuat terlebih dahulu, dengan pernyataan seperti CREATE SCHEMA looker_scratch;.
  • Parameter JDBC tambahan: Tambahkan parameter JDBC Hive tambahan di sini, seperti:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: Biarkan tidak dicentang.
  • Database Time Zone: Zona waktu data yang disimpan di Spark. Biasanya, zona waktu ini dapat dibiarkan kosong atau ditetapkan ke UTC.
  • Zona Waktu Kueri: Zona waktu untuk menampilkan data yang dikueri di Looker.

Untuk memverifikasi bahwa koneksi berhasil, klik Test. Lihat halaman dokumentasi Menguji konektivitas database untuk mengetahui informasi pemecahan masalah.

Untuk menyimpan setelan ini, klik Connect.

Dukungan fitur

Agar Looker dapat mendukung beberapa fitur, dialek database Anda juga harus mendukungnya.

Apache Spark 3+

Apache Spark 3+ mendukung fitur berikut per Looker 26.2:

Fitur Didukung?
Looker (Google Cloud core)
Agregat simetris
Tabel turunan
Tabel turunan berbasis SQL persisten
Tabel turunan berbasis persisten
Tampilan stabil
Penghentian kueri
Pivot berbasis SQL
Zona waktu
SSL
Subtotal
Parameter tambahan JDBC
Peka huruf besar/kecil
Jenis lokasi
Jenis daftar
Persentil
Persentil berbeda
SQL Runner Show Processes
SQL Runner Describe Table
SQL Runner Show Indexes
SQL Runner Select 10
SQL Runner Count
SQL Explain
Kredensial OAuth 2.0
Komentar konteks
Penggabungan koneksi
Sketsa HLL
Aggregate awareness
PDT inkremental
Milidetik
Mikrodetik
Tampilan terwujud
Metrik dari periode ke periode
Jumlah perkiraan berbeda

Langkah berikutnya

Setelah membuat koneksi, tetapkan opsi autentikasi.