Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Apache Hive

Halaman ini berisi informasi tentang cara menghubungkan Looker ke Apache Hive 2.3+ dan Apache Hive 3.1.2+.

Perhatikan hal berikut terkait dukungan Looker untuk berbagai versi Apache Hive:

Looker mendukung koneksi ke Apache Hive 2.3+ dan Apache Hive 3.1.2+:
- Untuk Apache Hive 2.3+, Looker memiliki dukungan tingkat integrasi.
- Untuk Apache Hive 3.1.2+, Looker dapat terintegrasi sepenuhnya dengan database Apache Hive 3 hanya pada versi yang lebih baru dari 3.1.2. Hal ini disebabkan oleh masalah penguraian kueri dari Hive versi 2.4.0 - 3.1.2 yang mengakibatkan waktu penguraian yang sangat lama untuk SQL yang dihasilkan Looker.
Looker tidak mendukung koneksi ke Apache Hive 2. Kueri pada koneksi ke Apache Hive 2 akan menampilkan error.

Mengenkripsi traffic jaringan

Praktik terbaiknya adalah mengenkripsi traffic jaringan antara aplikasi Looker dan database Anda. Pertimbangkan salah satu opsi yang dijelaskan di halaman dokumentasi Mengaktifkan akses database yang aman.

Pengantar

Looker dirancang untuk terhubung ke server database menggunakan JDBC. Dalam kasus Hive, ini adalah server thrift (HiveServer2). Lihat dokumentasi Apache untuk mengetahui informasi selengkapnya.

Secara default, server ini akan memproses port 10000.

Looker adalah alat kueri interaktif, sehingga diharapkan dapat berfungsi dengan mesin SQL interaktif. Jika Hive berjalan di MapReduce — hive.execution.engine ditetapkan ke mr — Hive akan menampilkan hasil kueri terlalu lambat untuk menjadi praktis.

Looker diuji dengan Hive di Tez (hive.execution.engine=tez), meskipun Looker juga dapat dijalankan terhadap Hive di Spark. Dukungan Spark ditambahkan di Hive versi 1.1. (Looker mendukung Hive 1.2.1+.)

Tabel turunan persisten (PDT)

Untuk mengaktifkan tabel turunan persisten (PDT) di Looker menggunakan koneksi Hive, buat skema sementara untuk digunakan Looker. Berikut adalah contoh perintah yang dapat Anda gunakan untuk membuat skema looker_scratch:

 CREATE SCHEMA looker_scratch;

Akun pengguna yang digunakan Looker untuk terhubung ke Hive (yang dapat bersifat anonim jika tidak ada autentikasi yang digunakan) harus memiliki kemampuan berikut dalam skema sementara:

Membuat tabel
Mengubah tabel
Menghapus tabel

Uji hal ini dengan klien JDBC sebelum mencoba membuat PDT dengan Hive.

Antrean

Jika Anda ingin kueri dari Looker masuk ke antrean tertentu, masukkan parameter nama antrean di kolom Additional JDBC parameters di halaman Connection Settings:

?tez.queue.name=the_bi_queue

Parameter Hive lainnya dapat ditetapkan dengan cara ini di kolom Additional JDBC parameters di halaman Connection Settings.

Dengan menggunakan atribut pengguna, kueri dari pengguna yang berbeda atau grup pengguna yang berbeda dapat masuk ke antrean yang berbeda. Untuk melakukannya, buat atribut pengguna yang diberi nama seperti queue_name; lalu, di kolom Additional JDBC parameters, tambahkan hal berikut:

?tez.queue.name={{ _user_attributes['queue_name'] }}

Anda juga dapat menggunakannya untuk menyesuaikan parameter hive-site.xml lainnya berdasarkan per pengguna atau per grup.

Membuat koneksi Looker ke database Anda

Ikuti langkah-langkah berikut untuk membuat koneksi dari Looker ke database Anda:

Di bagian Admin Looker, pilih Connections, lalu klik Add Connection.
Pilih Apache Hive 2.3+ atau Apache Hive 3.1.2+ dari menu drop-down Dialect.

Catatan: Jika Anda menggunakan instance Looker (Google Cloud core) dan tidak melihat dialek Anda tercantum di menu drop-down Dialect, lihat dokumentasi Looker (Google Cloud core) untuk memverifikasi bahwa dialek tersebut didukung untuk instance Looker (Google Cloud core).
Isi detail koneksi. Sebagian besar setelan sama untuk sebagian besar dialek database. Lihat halaman dokumentasi Menghubungkan Looker ke database Anda untuk mengetahui informasi selengkapnya. Beberapa setelan dijelaskan berikutnya:
- Nama: Tentukan nama koneksi. Nama ini akan digunakan untuk merujuk ke koneksi dalam project LookML.
- Host: Tentukan nama host.
- Port: Tentukan port database.
- Database: Tentukan nama database.
- Nama pengguna: Tentukan nama pengguna database.
- Password: Tentukan sandi pengguna database.
- Aktifkan PDT: Gunakan tombol ini untuk mengaktifkan tabel turunan persisten. Jika PDT diaktifkan, jendela Connection akan menampilkan setelan PDT tambahan dan bagian PDT Overrides.
- Temp Database: Tentukan nama skema sementara yang dibuat di bagian Tabel turunan persisten (PDT) di halaman dokumentasi ini.
- Jumlah maksimum koneksi pembuat PDT: Tentukan jumlah build PDT serentak yang mungkin pada koneksi ini. Menetapkan nilai ini terlalu tinggi dapat berdampak negatif pada waktu kueri. Untuk mengetahui informasi selengkapnya, lihat halaman dokumentasi Menghubungkan Looker ke database Anda.
- Additional JDBC parameters: Tambahkan parameter JDBC tambahan. Lihat bagian Parameter JDBC yang didukung di halaman ini untuk mengetahui daftar parameter yang didukung.
- Jadwal Pemeliharaan: Tentukan ekspresi cron yang menunjukkan kapan Looker harus memeriksa grup data dan tabel turunan persisten. Baca lebih lanjut setelan ini di dokumentasi Jadwal Pemeliharaan.
- SSL: Centang untuk menggunakan koneksi SSL.
- Verifikasi SSL: Centang untuk verifikasi nama host.
- Max connections per node: Setelan ini dapat dibiarkan pada nilai default pada awalnya. Lihat halaman dokumentasi Menghubungkan Looker ke database Anda untuk mengetahui informasi selengkapnya.
- Connection Pool Timeout: Setelan ini dapat dibiarkan pada nilai default pada awalnya. Baca lebih lanjut setelan ini di bagian Connection Pool Timeout di halaman dokumentasi Menghubungkan Looker ke database Anda.
- SQL Runner Precache: Untuk mencegah SQL Runner memuat informasi tabel secara otomatis dan hanya memuat informasi tabel saat tabel dipilih, hapus centang pada opsi ini. Baca lebih lanjut setelan ini di bagian SQL Runner Precache di halaman dokumentasi Menghubungkan Looker ke database Anda.
- Zona Waktu Database: Tentukan zona waktu yang digunakan dalam database. Biarkan kolom ini kosong jika Anda tidak ingin konversi zona waktu. Lihat halaman dokumentasi Menggunakan setelan zona waktu untuk mengetahui informasi selengkapnya.
Untuk memverifikasi bahwa koneksi berhasil, klik Test. Lihat halaman dokumentasi Menguji konektivitas database untuk mengetahui informasi pemecahan masalah.
Untuk menyimpan setelan ini, klik Connect.

Parameter JDBC yang didukung

Untuk Apache Hive, Looker mendukung parameter JDBC berikut di kolom Additional JDBC parameters untuk koneksi. Lihat dokumentasi untuk database Anda guna mengetahui informasi tentang parameter ini.

fetchSize
httpPath
keyStorePassword
password
principal
serviceDiscoveryMode
ssl
tez.queue.name
transportMode
twoWay
user
zooKeeperNamespace

Dukungan fitur

Agar Looker dapat mendukung beberapa fitur, dialek database Anda juga harus mendukungnya.

Apache Hive 2.3+

Apache Hive 2.3+ mendukung fitur berikut mulai Looker 26.10:

Fitur	Didukung?
Looker (Google Cloud core)
Agregat simetris
Tabel turunan
Tabel turunan SQL persisten
Tabel turunan native persisten
Tampilan stabil
Penghentian kueri
Pivot berbasis SQL
Zona waktu
SSL
Subtotal
Parameter tambahan JDBC
Peka huruf besar/kecil
Jenis lokasi
Jenis daftar
Persentil
Persentil berbeda
SQL Runner Show Processes
SQL Runner Describe Table
SQL Runner Show Indexes
SQL Runner Select 10
SQL Runner Count
SQL Explain
Kredensial OAuth 2.0
Komentar konteks
Penggabungan koneksi
Sketsa HLL
Aggregate awareness
PDT inkremental
Milidetik
Mikrodetik
Tampilan terwujud
Ukuran dari periode ke periode
Jumlah perkiraan berbeda
Model analisis dalam database
Kalender kustom

Apache Hive 3.1.2+

Apache Hive 3.1.2+ mendukung fitur berikut mulai Looker 26.10:

Fitur	Didukung?
Looker (Google Cloud core)
Agregat simetris
Tabel turunan
Tabel turunan SQL persisten
Tabel turunan native persisten
Tampilan stabil
Penghentian kueri
Pivot berbasis SQL
Zona waktu
SSL
Subtotal
Parameter tambahan JDBC
Peka huruf besar/kecil
Jenis lokasi
Jenis daftar
Persentil
Persentil berbeda
SQL Runner Show Processes
SQL Runner Describe Table
SQL Runner Show Indexes
SQL Runner Select 10
SQL Runner Count
SQL Explain
Kredensial OAuth 2.0
Komentar konteks
Penggabungan koneksi
Sketsa HLL
Aggregate awareness
PDT inkremental
Milidetik
Mikrodetik
Tampilan terwujud
Ukuran dari periode ke periode
Jumlah perkiraan berbeda
Model analisis dalam database
Kalender kustom

Langkah berikutnya

Setelah menghubungkan database ke Looker, konfigurasi opsi login untuk pengguna Anda.