Amazon Athena

Looker mendukung koneksi ke Amazon Athena, layanan kueri interaktif yang memungkinkan Anda menganalisis data di Amazon S3 menggunakan SQL standar. Amazon Athena bersifat serverless, jadi tidak ada infrastruktur yang perlu dikelola. Anda hanya dikenai biaya untuk kueri yang dijalankan.

Mengenkripsi traffic jaringan

Sebaiknya enkripsi traffic jaringan antara aplikasi Looker dan database Anda. Pertimbangkan salah satu opsi yang dijelaskan di halaman dokumentasi Mengaktifkan akses database yang aman.

Mengonfigurasi koneksi Amazon Athena

Halaman ini menjelaskan cara menghubungkan Looker ke instance Amazon Athena.

  1. Pastikan Anda memiliki hal berikut:

    • Sepasang kunci akses Amazon AWS.
    • Bucket S3 yang berisi data yang ingin Anda kueri di Looker dengan Amazon Athena. Kunci akses Amazon AWS harus memiliki akses baca-tulis ke bucket ini.

      Amazon Athena harus memiliki akses ke bucket S3 ini berdasarkan peran atau set izin, serta berdasarkan aturan firewall. Jangan tambahkan aturan keamanan ke bucket S3 untuk IP Looker, karena hal ini dapat secara tidak sengaja memblokir akses Amazon Athena ke bucket S3. (Untuk dialek lain selain Amazon Athena, pengguna mungkin ingin membatasi akses ke data dari lapisan jaringan dengan daftar yang diizinkan IP, seperti yang dijelaskan di halaman dokumentasi Mengaktifkan akses database yang aman.)

    • Pengetahuan tentang lokasi data instance Amazon Athena Anda. Nama region dapat ditemukan di bagian kanan atas Konsol Amazon.

  2. Di bagian Admin Looker, pilih Connections, lalu klik Add Connection.

  3. Isi detail koneksi:

    • Nama: Tentukan nama koneksi. Dengan nama ini, Anda akan merujuk ke koneksi dalam project LookML.
    • Dialect: Pilih Amazon Athena.
    • Host dan Port: Tentukan nama host dan port seperti yang dijelaskan dalam dokumentasi Athena tentang format URL JDBC. Host harus berupa endpoint Amazon yang valid (seperti athena.eu-west-1.amazonaws.com), dan port harus tetap di 443. Daftar endpoint terbaru yang mendukung Athena dapat ditemukan di halaman Referensi Umum AWS ini.
    • Database: Tentukan database default yang ingin Anda modelkan. Database lain dapat diakses, tetapi Looker memperlakukan database ini sebagai database default.
    • Nama Pengguna: Tentukan ID kunci akses AWS.
    • Kata Sandi: Tentukan kunci akses rahasia AWS.
    • Aktifkan PDT: Gunakan tombol ini untuk mengaktifkan tabel turunan persisten (PDT). Mengaktifkan PDT akan menampilkan kolom PDT tambahan dan bagian PDT Overrides untuk koneksi.
    • Temp Database: Tentukan nama direktori output di bucket S3 tempat Anda ingin Looker menulis PDT. Jalur lengkap ke direktori output harus ditentukan di kolom Additional JDBC parameters ; lihat bagian Menentukan bucket S3 untuk output hasil kueri dan PDT di halaman ini.
    • Jumlah maksimum koneksi pembuat PDT: Tentukan jumlah kemungkinan build PDT serentak pada koneksi ini. Menetapkan nilai ini terlalu tinggi dapat berdampak negatif pada waktu kueri. Untuk mengetahui informasi selengkapnya, lihat halaman dokumentasi Menghubungkan Looker ke database.
    • Additional JDBC parameters: Tentukan parameter tambahan untuk koneksi:
    • SSL: Abaikan; secara default, semua koneksi ke AWS API akan dienkripsi.
    • Max connections per node: Secara default, nilai ini ditetapkan ke 5. Anda dapat meningkatkan nilai ini hingga 20 jika Looker adalah mesin kueri utama yang berjalan terhadap Athena. Lihat dokumentasi batas layanan Athena untuk mengetahui detail selengkapnya tentang batas layanan. Lihat halaman dokumentasi Menghubungkan Looker ke database untuk mengetahui informasi selengkapnya.
    • Connection Pool Timeout: Tentukan waktu tunggu kumpulan koneksi. Secara default, waktu tunggu ditetapkan ke 120 detik. Lihat halaman dokumentasi Menghubungkan Looker ke database untuk mengetahui informasi selengkapnya.
    • SQL Runner Precache: Batalkan pilihan opsi ini jika Anda lebih suka SQL Runner memuat informasi tabel hanya saat tabel dipilih. Lihat halaman dokumentasi Menghubungkan Looker ke database untuk mengetahui informasi selengkapnya.
    • Zona Waktu Database: Tentukan zona waktu yang digunakan dalam database. Biarkan kolom ini kosong jika Anda tidak ingin konversi zona waktu. Lihat halaman dokumentasi Menggunakan setelan zona waktu untuk mengetahui informasi selengkapnya.

Untuk memverifikasi bahwa koneksi berhasil, klik Test. Lihat halaman dokumentasi Menguji konektivitas database untuk mengetahui informasi pemecahan masalah.

Untuk menyimpan setelan ini, klik Connect.

Menentukan bucket S3 untuk output hasil kueri dan PDT

Gunakan kolom Additional JDBC parameters di halaman Connections untuk mengonfigurasi jalur ke bucket S3 yang akan digunakan Looker untuk menyimpan output hasil kueri, dan untuk menentukan nama direktori output di bucket S3 tempat Anda ingin Looker menulis PDT. Tentukan informasi ini menggunakan parameter s3_staging_dir.

Parameter JDBC s3_staging_dir adalah cara alternatif untuk mengonfigurasi properti S3OutputLocation Amazon Athena, yang diperlukan untuk koneksi JDBC Athena. Lihat dokumentasi Athena tentang Opsi Driver JDBC untuk mengetahui informasi selengkapnya dan daftar semua opsi driver JDBC yang tersedia.

Di kolom Additional JDBC parameters, tentukan parameter s3_staging_dir menggunakan format berikut:

`s3_staging_dir=s3://<s3-bucket>/<output-path>`

Dengan:

  • <s3-bucket> adalah nama bucket S3.
  • <output-path> adalah jalur tempat Looker akan menulis output hasil kueri.

Pasangan kunci akses AWS harus memiliki izin tulis ke direktori <s3-bucket>.

Untuk mengonfigurasi direktori tempat Looker akan menulis PDT, masukkan jalur direktori di bucket S3 di kolom Temp Database. Misalnya, jika Anda ingin Looker menulis PDT ke s3://<s3-bucket>/looker_scratch, masukkan hal ini di kolom Temp Database:

`looker_scratch`

Hanya masukkan jalur direktori. Looker mendapatkan nama bucket S3 dari parameter s3_staging_dir yang Anda masukkan di kolom Additional JDBC Parameters.

Pertimbangan bucket S3

Sebaiknya konfigurasikan siklus proses objek Amazon S3 untuk membersihkan file yang tidak diperlukan secara berkala di bucket S3 yang Anda tentukan. Ada beberapa alasan untuk hal ini:

  • Athena menyimpan hasil kueri untuk setiap kueri di bucket S3. Lihat Kueri Athena.
  • Jika Anda mengaktifkan PDT, saat PDT dibuat, metadata tentang tabel yang dibuat akan disimpan di bucket S3.

Resource

Parameter JDBC yang didukung

Untuk Amazon Athena, Looker mendukung parameter JDBC berikut di kolom Additional JDBC parameters untuk koneksi. Lihat dokumentasi untuk database Anda guna mengetahui informasi tentang parameter ini.

  • ApplicationName
  • AwsCredentialsProviderArguments
  • AwsCredentialsProviderClass
  • AwsRegion
  • Catalog
  • Database
  • EnableResultReuseByAge
  • EndPointOverride
  • LogLevel
  • MaxQueryExecutionPollingInterval
  • maxResultReuseAgeInMinutes
  • MetadataRetrievalMethod
  • MinQueryExecutionPollingInterval
  • OutputLocation
  • password
  • ProxyHost
  • ProxyPort
  • ProxyPWD
  • ProxyUID
  • QueryExecutionPollingIntervalMultiplier
  • Region
  • ResultFetcher
  • ResultReuseByAgeConfiguration
  • s3_staging_dir
  • S3OutputEncOption
  • S3OutputLocation
  • Schema
  • user
  • UseResultsetStreaming
  • WorkGroup

Dukungan fitur

Agar Looker dapat mendukung beberapa fitur, dialek database Anda juga harus mendukungnya.

Amazon Athena mendukung fitur berikut mulai Looker 26.10:

Fitur Didukung?
Looker (Google Cloud core)
Agregat simetris
Tabel turunan
Tabel turunan SQL persisten
Tabel turunan native persisten
Tampilan stabil
Penghentian kueri
Pivot berbasis SQL
Zona waktu
SSL
Subtotal
Parameter tambahan JDBC
Peka huruf besar/kecil
Jenis lokasi
Jenis daftar
Persentil
Persentil berbeda
SQL Runner Show Processes
SQL Runner Describe Table
SQL Runner Show Indexes
SQL Runner Select 10
SQL Runner Count
SQL Explain
Kredensial OAuth 2.0
Komentar konteks
Penggabungan koneksi
Sketsa HLL
Aggregate awareness
PDT inkremental
Milidetik
Mikrodetik
Tampilan terwujud
Ukuran dari periode ke periode
Jumlah perkiraan berbeda
Model analisis dalam database
Kalender kustom

Langkah berikutnya

Setelah menyelesaikan koneksi database, konfigurasikan opsi autentikasi.