Menggunakan Dataplex Universal Catalog dengan MCP, Gemini, dan agen lainnya

Halaman ini menjelaskan cara menghubungkan instance Katalog Universal Dataplex Anda ke alat developer seperti Gemini CLI. Menghubungkan Dataplex Universal Catalog ke alat ini memungkinkan penemuan data dan pengelolaan aset yang didukung AI secara langsung dalam IDE Anda.

Untuk pengalaman command line terintegrasi, sebaiknya gunakan ekstensi Dataplex Universal Catalog khusus untuk Gemini CLI. Ekstensi ini menggabungkan server Model Context Protocol (MCP) yang mendasarinya, yang bertindak sebagai perantara antara Gemini CLI dan Katalog Universal Dataplex, sehingga tidak perlu penyiapan server terpisah.

Atau, Anda dapat menghubungkan IDE dan alat developer lain yang mendukung MCP dengan menggunakan MCP Toolbox for Databases serbaguna. Kemudian, Anda dapat menggunakan agen AI di IDE yang ada untuk menemukan aset data di Dataplex Universal Catalog. Untuk mengetahui informasi selengkapnya tentang MCP, lihat Pengantar Model Context Protocol.

Panduan ini menunjukkan proses koneksi untuk alat berikut:

Tentang Gemini CLI dan ekstensi

Gemini CLI adalah agen AI percakapan open source dari Google yang mempercepat alur kerja pengembangan dan membantu coding, proses debug, eksplorasi data, dan pembuatan konten. Layanan ini menawarkan pengalaman berbasis agen untuk berinteraksi dengan layanan Data Cloud, seperti Dataplex Universal Catalog, dan database open source populer lainnya.

Untuk mengetahui informasi selengkapnya tentang Gemini CLI, lihat dokumentasi Gemini CLI.

Cara kerja ekstensi

Ekstensi memperluas kemampuan Gemini CLI, sehingga dapat terhubung ke dan mengontrol layanan tertentu serta alat lainnya. Google Cloud Plugin ini memberikan konteks dan pemahaman API kepada Gemini, sehingga memungkinkan interaksi percakapan. Anda dapat memuat ekstensi Gemini CLI dari URL GitHub, direktori lokal, atau registry. Ekstensi ini menawarkan alat, perintah garis miring, dan perintah baru. Alat ini terpisah dari ekstensi IDE, seperti Gemini Code Assist, yang terintegrasi menggunakan MCP Toolbox.

Tentang ekstensi Dataplex Universal Catalog

MCP Toolbox for Databases masih dalam versi beta (pra-v1.0), dan mungkin mengalami perubahan yang dapat menyebabkan gangguan hingga rilis stabil pertama (v1.0).

Ekstensi Dataplex Universal Catalog untuk Gemini CLI mengintegrasikan AI ke dalam tugas tata kelola dan penemuan data Anda. Anda dapat berinteraksi dengan Dataplex Universal Catalog menggunakan perintah bahasa alami di terminal. Berikut beberapa contohnya:

Kategori Alat Contoh perintah bahasa alami
Penemuan dan tata kelola data dataplex_search_entries
  • Temukan semua set data yang terkait dengan penjualan di Eropa.
  • Tampilkan tabel yang berisi PII pelanggan.
  • Mencantumkan semua set data BigQuery di data lake 'marketing' di Dataplex Universal Catalog.
dataplex_lookup_entry
  • Apa skema tabel 'orders'?
  • Jelaskan aturan kualitas data yang diterapkan ke database pelanggan.
  • Siapa yang tercantum sebagai pemilik bisnis untuk tabel `customer_details`?
dataplex_search_aspect_types
  • Tampilkan jenis aspek yang terkait dengan aturan kualitas data.
  • Mencantumkan semua jenis aspek yang digunakan untuk tata kelola data.
  • Apakah ada jenis aspek untuk menandai data PII?

Untuk mengetahui informasi selengkapnya tentang ekstensi Dataplex Universal Catalog, lihat Ekstensi Gemini CLI - Dataplex Universal Catalog.

Peran dan izin yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk terhubung ke Dataplex Universal Catalog menggunakan MCP Toolbox atau ekstensi Gemini CLI, minta administrator untuk memberi Anda peran IAM berikut di project Anda:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk terhubung ke Katalog Universal Dataplex menggunakan MCP Toolbox atau ekstensi Gemini CLI. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk terhubung ke Dataplex Universal Catalog menggunakan MCP Toolbox atau ekstensi Gemini CLI:

  • Untuk mengaktifkan API: serviceusage.services.enable
  • Untuk menggunakan alat Katalog Universal Dataplex:
    • dataplex.projects.search
    • dataplex.entries.get
    • dataplex.aspectTypes.get
    • dataplex.aspectTypes.list

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Mengaktifkan Dataplex Universal Catalog API

  1. Tinjau izin yang diperlukan untuk menyelesaikan tugas dalam panduan ini.
  2. In the Google Cloud console, go to the project selector page.

    Go to project selector

  3. Select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Dataplex API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  6. If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

    If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

Menginstal Toolbox MCP

Anda tidak perlu menginstal MCP Toolbox jika hanya berencana menggunakan Gemini Code Assist atau ekstensi Gemini CLI, karena keduanya menggabungkan kemampuan server yang diperlukan. Untuk IDE dan alat lainnya, ikuti langkah-langkah di bagian ini untuk menginstal MCP Toolbox.

  1. Download MCP Toolbox versi terbaru sebagai biner. Pilih biner yang sesuai dengan arsitektur CPU dan (OS) Anda. Anda harus menggunakan MCP Toolbox v0.15.0 atau yang lebih baru.

    Linux/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/linux/amd64/toolbox
    

    Ganti VERSION dengan versi MCP Toolbox, misalnya, v0.15.0.

    macOS (Darwin)/arm64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/arm64/toolbox
    

    Ganti VERSION dengan versi MCP Toolbox, misalnya, v0.15.0.

    macOS (Darwin)/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/amd64/toolbox
    

    Ganti VERSION dengan versi MCP Toolbox, misalnya, v0.15.0.

    Windows/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/windows/amd64/toolbox
    

    Ganti VERSION dengan versi MCP Toolbox, misalnya, v0.15.0.

  2. Jadikan biner sebagai file yang dapat dieksekusi:

    chmod +x toolbox
    
  3. Verifikasi penginstalannya:

    ./toolbox --version
    

    Penginstalan yang berhasil akan menampilkan nomor versi, misalnya, 0.15.0.

Menyiapkan klien dan koneksi

Bagian ini menjelaskan cara menghubungkan Katalog Universal Dataplex ke alat Anda.

Jika Anda menggunakan Gemini Code Assist atau Gemini CLI mandiri, Anda tidak perlu menginstal atau mengonfigurasi MCP Toolbox, karena alat ini menggabungkan kemampuan server yang diperlukan. Untuk petunjuk penyiapan, lihat tab Ekstensi Gemini Code Assist atau Gemini CLI.

Untuk alat dan IDE lain yang kompatibel dengan MCP, Anda harus menginstal MCP Toolbox terlebih dahulu. Toolbox ini berfungsi sebagai server Model Context Protocol (MCP) open source yang berada di antara IDE dan Dataplex Universal Catalog, sehingga memberikan bidang kontrol yang aman dan efisien untuk alat AI Anda. Setelah penginstalan, pilih tab untuk alat tertentu Anda guna melihat petunjuk konfigurasi.

Ekstensi Gemini CLI

Metode ini menggunakan ekstensi dataplex khusus untuk alat CLI Gemini mandiri, dan tidak menggunakan MCP Toolbox.

  1. Instal Gemini CLI.
  2. Instal ekstensi Dataplex Universal Catalog untuk Gemini CLI dari repositori GitHub:
    gemini extensions install https://github.com/gemini-cli-extensions/dataplex
  3. Tetapkan variabel lingkungan untuk terhubung ke project Katalog Universal Dataplex Anda:
    export DATAPLEX_PROJECT="PROJECT_ID"

    Ganti PROJECT_ID dengan Google Cloud project ID Anda.

  4. Mulai Gemini CLI dalam mode interaktif:
    gemini
    CLI akan otomatis memuat ekstensi Dataplex Universal Catalog dan alatnya, yang dapat Anda gunakan untuk berinteraksi dengan aset data Anda.

Gemini Code Assist

Gemini Code Assist menggabungkan kemampuan server MCP yang diperlukan, sehingga Anda tidak perlu menginstal MCP Toolbox secara terpisah.

  1. Di VS Code, instal ekstensi Gemini Code Assist.
  2. Aktifkan Mode Agen di percakapan Gemini Code Assist.
  3. Di direktori kerja Anda, buat folder bernama .gemini. Di dalamnya, buat file settings.json.
  4. Tambahkan konfigurasi berikut, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Kode Claude

  1. Instal Claude Code.
  2. Buat file .mcp.json di root project Anda, jika tidak ada.
  3. Tambahkan konfigurasi, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Claude desktop

  1. Buka Claude Desktop, lalu buka Settings.
  2. Untuk membuka file konfigurasi, di tab Developer, klik Edit config.
  3. Tambahkan konfigurasi, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. Mulai ulang Claude desktop.
    Layar chat baru menampilkan ikon MCP dengan server MCP baru.

Cline

  1. Di VS Code, buka ekstensi Cline lalu klik ikon MCP Servers.
  2. Untuk membuka file konfigurasi, ketuk Configure MCP Servers.
  3. Tambahkan konfigurasi berikut, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
    Status aktif berwarna hijau akan muncul setelah server berhasil terhubung.

Kursor

  1. Buat direktori .cursor di root project Anda jika belum ada.
  2. Buat file .cursor/mcp.json jika tidak ada dan buka file tersebut.
  3. Tambahkan konfigurasi berikut, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. Buka Kursor, lalu buka Setelan>Setelan Kursor > MCP. Status aktif berwarna hijau akan muncul saat server terhubung.

VS Code (Copilot)

  1. Buka VS Code dan buat direktori .vscode di root project Anda jika belum ada.
  2. Buat file .vscode/mcp.json jika tidak ada, lalu buka file tersebut.
  3. Tambahkan konfigurasi berikut, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "servers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Selancar Angin

  1. Buka Windsurf dan buka asisten Cascade.
  2. Untuk membuka file konfigurasi, klik ikon MCP, lalu klik Konfigurasi.
  3. Tambahkan konfigurasi berikut, ganti variabel lingkungan dengan nilai Anda, lalu simpan:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Menggunakan alat

Alat AI Anda kini terhubung ke Dataplex Universal Catalog. Coba minta asisten AI Anda untuk menemukan beberapa aset data seperti set data BigQuery, instance Cloud SQL, dan lainnya.

Alat berikut tersedia untuk LLM:

Opsional: Menambahkan petunjuk sistem

Petunjuk sistem adalah cara untuk memberikan panduan khusus kepada LLM, membantunya memahami konteks dan merespons dengan lebih akurat. Siapkan petunjuk sistem berdasarkan perintah sistem yang direkomendasikan.

Misalnya, Anda dapat menambahkan petunjuk untuk memandu LLM tentang cara menggunakan alat Dataplex Universal Catalog:

  • Saat diminta untuk menemukan set data atau tabel, gunakan alat dataplex_search_entries.
  • Jika diminta untuk memberikan detail skema atau metadata tabel seperti aturan kualitas data atau kepemilikan, gunakan alat dataplex_lookup_entry.
  • Saat ditanya tentang aturan atau klasifikasi tata kelola, mulailah dengan menggunakan dataplex_search_aspect_types untuk menemukan jenis aspek yang relevan.

Untuk mengetahui informasi selengkapnya tentang cara mengonfigurasi petunjuk, lihat Menggunakan petunjuk untuk mendapatkan hasil edit AI yang mengikuti gaya coding Anda.

Langkah berikutnya