שימוש ב-Dataplex Universal Catalog עם MCP,‏ Gemini וסוכנים אחרים

בדף הזה מוסבר איך לקשר את המופע של Dataplex Universal Catalog לכלי פיתוח כמו Gemini CLI. קישור Dataplex Universal Catalog לכלים האלה מאפשר גילוי נתונים וניהול נכסים באמצעות AI ישירות בסביבת הפיתוח המשולבת (IDE).

כדי ליהנות מחוויית שורת פקודה משולבת, מומלץ להשתמש בתוסף הייעודי Dataplex Universal Catalog ל-Gemini CLI. התוסף כולל את שרת Model Context Protocol ‏ (MCP) הבסיסי, שמשמש כמתווך בין Gemini CLI לבין Dataplex Universal Catalog, ולכן אין צורך בהגדרת שרת נפרד.

אפשר גם לחבר סביבות פיתוח משולבות (IDE) וכלים אחרים למפתחים שתומכים ב-MCP באמצעות MCP Toolbox for Databases (ארגז הכלים של MCP למסדי נתונים) לשימוש כללי. לאחר מכן תוכלו להשתמש בסוכני AI בסביבת הפיתוח המשולבת הקיימת שלכם כדי לגלות נכסי נתונים ב-Dataplex Universal Catalog. מידע נוסף על MCP זמין במאמר מבוא ל-Model Context Protocol.

במדריך הזה מוסבר תהליך החיבור של הכלים הבאים:

מידע על Gemini CLI ותוספים

‫Gemini CLI הוא סוכן AI בממשק שיחה של Google, בקוד פתוח, שמאיץ את תהליכי העבודה של הפיתוח ועוזר בכתיבת קוד, בניפוי באגים, בחיפוש נתונים וביצירת תוכן. הוא מציע חוויה מבוססת-סוכן לאינטראקציה עם שירותי Data Cloud, כמו Dataplex Universal Catalog, ומסדי נתונים פופולריים אחרים בקוד פתוח.

מידע נוסף על Gemini CLI זמין במסמכי התיעוד של Gemini CLI.

איך תוספים פועלים

התוספים מרחיבים את היכולות של Gemini CLI, ומאפשרים לו להתחבר לשירותים ספציפיים ולכלים אחרים ולשלוט בהם. Google Cloud הם מספקים ל-Gemini הקשר והבנה של ה-API, ומאפשרים אינטראקציה שיחתית. אפשר לטעון תוספים ל-Gemini CLI מכתובות URL ב-GitHub, מספריות מקומיות או ממאגרי תוספים. התוספים האלה מציעים כלים חדשים, פקודות סלאש והנחיות. הם נפרדים מתוספים לסביבת פיתוח משולבת (IDE), כמו Gemini Code Assist, שמשולבים באמצעות ערכת הכלים של MCP.

מידע על התוסף Dataplex Universal Catalog

הכלי MCP Toolbox for Databases נמצא בגרסת בטא (לפני גרסה 1.0), ויכול להיות שיחולו בו שינויים שעלולים לשבור את התאימות עד לגרסה היציבה הראשונה (גרסה 1.0).

התוסף Dataplex Universal Catalog ל-Gemini CLI משלב AI במשימות של משילות מידע וגילוי נתונים. אתם יכולים לקיים אינטראקציה עם Dataplex Universal Catalog באמצעות הנחיות בשפה טבעית במסוף. הנה כמה דוגמאות:

קטגוריה כלי דוגמה להנחיה בשפה טבעית
גילוי נתונים ומשילות מידע dataplex_search_entries
  • איתור כל מערכי הנתונים שקשורים למכירות באירופה.
  • תראה לי טבלאות שמכילות פרטים אישיים מזהים של לקוחות.
  • הצגת רשימה של כל מערכי הנתונים ב-BigQuery באגם 'שיווק' ב-Dataplex Universal Catalog.
dataplex_lookup_entry
  • מה הסכימה של הטבלה 'orders'?
  • תאר את הכללים לאיכות הנתונים שחלים על מסד הנתונים של הלקוחות.
  • מי מופיע כבעל עסק בטבלה customer_details?
dataplex_search_aspect_types
  • תראה לי סוגי היבטים שקשורים לכללים של איכות הנתונים.
  • רשימה של כל סוגי ההיבטים שמשמשים למשילות מידע (data governance).
  • האם יש סוגים של היבטים לסימון נתוני PII?

מידע נוסף על התוסף Dataplex Universal Catalog זמין במאמר בנושא תוסף ל-Gemini CLI - Dataplex Universal Catalog.

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות לחיבור אל Dataplex Universal Catalog באמצעות MCP Toolbox או תוסף ל-Gemini CLI, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

התפקידים המוגדרים מראש האלה מכילים את ההרשאות שנדרשות כדי להתחבר אל Dataplex Universal Catalog באמצעות MCP Toolbox או תוסף ל-Gemini CLI. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי להתחבר ל-Dataplex Universal Catalog באמצעות MCP Toolbox או תוסף ל-Gemini CLI, נדרשות ההרשאות הבאות:

  • כדי להפעיל ממשקי API: serviceusage.services.enable
  • כדי להשתמש בכלים של Dataplex Universal Catalog:
    • dataplex.projects.search
    • dataplex.entries.get
    • dataplex.aspectTypes.get
    • dataplex.aspectTypes.list

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

הפעלת Dataplex API

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
  3. Verify that billing is enabled for your Google Cloud project.

  4. If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

    If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

התקנת MCP Toolbox

אם אתם מתכננים להשתמש רק ב-Gemini Code Assist או בתוסף ל-Gemini CLI, אתם לא צריכים להתקין את MCP Toolbox, כי הם כוללים את היכולות הנדרשות של השרת. כדי להתקין את MCP Toolbox ב-IDE ובכלים אחרים, צריך לפעול לפי השלבים שבקטע הזה.

  1. מורידים את הגרסה האחרונה של MCP Toolbox כקובץ בינארי. בוחרים את הקובץ הבינארי שמתאים למערכת ההפעלה ולארכיטקטורת המעבד. חובה להשתמש ב-MCP Toolbox בגרסה 0.15.0 ואילך.

    Linux/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/linux/amd64/toolbox
    

    מחליפים את VERSION בגרסה של MCP Toolbox – לדוגמה, v0.15.0.

    ‫macOS (Darwin)/arm64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/arm64/toolbox
    

    מחליפים את VERSION בגרסה של MCP Toolbox – לדוגמה, v0.15.0.

    ‫macOS (Darwin)/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/amd64/toolbox
    

    מחליפים את VERSION בגרסה של MCP Toolbox – לדוגמה, v0.15.0.

    Windows/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/windows/amd64/toolbox
    

    מחליפים את VERSION בגרסה של MCP Toolbox – לדוגמה, v0.15.0.

  2. הופכים את הקובץ הבינארי לקובץ הפעלה:

    chmod +x toolbox
    
  3. מאמתים את ההתקנה:

    ./toolbox --version
    

    אם ההתקנה מצליחה, מוחזר מספר הגרסה, לדוגמה, 0.15.0.

הגדרת לקוחות וחיבורים

בקטע הזה מוסבר איך לחבר את Dataplex Universal Catalog לכלים שלכם.

אם אתם משתמשים ב-Gemini Code Assist או ב-Gemini CLI העצמאי, אתם לא צריכים להתקין או להגדיר את MCP Toolbox, כי הכלים האלה כוללים את היכולות הנדרשות של השרת. להוראות הגדרה, ראו את הכרטיסיות Gemini Code Assist או תוסף ל-Gemini CLI.

כדי להשתמש בכלים ובסביבות פיתוח משולבות (IDE) אחרים שתואמים ל-MCP, צריך קודם להתקין את MCP Toolbox. ערכת הכלים פועלת כשרת Model Context Protocol‏ (MCP) בקוד פתוח, שממוקם בין סביבת הפיתוח המשולבת (IDE) לבין Dataplex Universal Catalog. היא מספקת מישור בקרה מאובטח ויעיל לכלים מבוססי-AI. אחרי ההתקנה, בוחרים את הכרטיסייה של הכלי הספציפי כדי לראות את הוראות ההגדרה.

תוסף ל-Gemini CLI

בשיטה הזו משתמשים בתוסף dataplex הייעודי לכלי Gemini CLI העצמאי, ולא משתמשים ב-MCP Toolbox.

  1. מתקינים את Gemini CLI.
  2. מתקינים את התוסף Dataplex Universal Catalog ל-Gemini CLI ממאגר GitHub:
    gemini extensions install https://github.com/gemini-cli-extensions/dataplex
  3. מגדירים את משתנה הסביבה כדי להתחבר לפרויקט Dataplex Universal Catalog:
    export DATAPLEX_PROJECT="PROJECT_ID"

    מחליפים את PROJECT_ID במזהה הפרויקט ב- Google Cloud .

  4. מפעילים את Gemini CLI במצב אינטראקטיבי:
    gemini
    ה-CLI טוען באופן אוטומטי את התוסף Dataplex Universal Catalog ואת הכלים שלו, שאפשר להשתמש בהם כדי ליצור אינטראקציה עם נכסי הנתונים.

Gemini Code Assist

‫Gemini Code Assist כולל את היכולות הנדרשות של שרת ה-MCP, כך שאין צורך להתקין את MCP Toolbox בנפרד.

  1. ב-VS Code, מתקינים את התוסף Gemini Code Assist.
  2. הפעלת מצב סוכן בצ'אט של Gemini Code Assist.
  3. בספריית העבודה, יוצרים תיקייה בשם .gemini. בתוך התיקייה הזו, יוצרים קובץ settings.json.
  4. מוסיפים את ההגדרה הבאה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Claude code

  1. מתקינים את Claude Code.
  2. יוצרים קובץ .mcp.json בתיקיית הבסיס של הפרויקט, אם הוא לא קיים.
  3. מוסיפים את ההגדרה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

‫Claude למחשב

  1. פותחים את Claude Desktop ועוברים אל Settings (הגדרות).
  2. כדי לפתוח את קובץ התצורה, בכרטיסייה Developer (מפתחים), לוחצים על Edit config (עריכת ההגדרות).
  3. מוסיפים את ההגדרה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. מפעילים מחדש את Claude למחשב.
    במסך הצ'אט החדש מוצג סמל MCP עם שרת ה-MCP החדש.

Cline

  1. ב-VS Code, פותחים את התוסף Cline ואז לוחצים על הסמל MCP Servers.
  2. כדי לפתוח את קובץ התצורה, מקישים על Configure MCP Servers (הגדרת שרתי MCP).
  3. מוסיפים את ההגדרה הבאה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
    אחרי שהשרת מתחבר בהצלחה, מופיע סטטוס פעיל בצבע ירוק.

סמן

  1. יוצרים את הספרייה .cursor בתיקיית הבסיס של הפרויקט אם היא לא קיימת.
  2. יוצרים את הקובץ .cursor/mcp.json אם הוא לא קיים ופותחים אותו.
  3. מוסיפים את ההגדרה הבאה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. פותחים את Cursor ועוברים אל הגדרות> הגדרות הסמן > MCP. כשמתבצע חיבור לשרת, מופיע סטטוס פעיל בצבע ירוק.

VS Code (Copilot)

  1. פותחים את VS Code ויוצרים את הספרייה .vscode בתיקיית הבסיס של הפרויקט, אם היא לא קיימת.
  2. יוצרים את הקובץ .vscode/mcp.json אם הוא לא קיים, ופותחים אותו.
  3. מוסיפים את ההגדרה הבאה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "servers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

גלישת רוח

  1. פותחים את Windsurf ועוברים אל Cascade assistant.
  2. כדי לפתוח את קובץ התצורה, לוחצים על סמל ה-MCP ואז על Configure (הגדרה).
  3. מוסיפים את ההגדרה הבאה, מחליפים את משתני הסביבה בערכים שלכם ושומרים:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

שימוש בכלים

כלי ה-AI שלכם מחובר עכשיו ל-Dataplex Universal Catalog. נסו לבקש מהעוזר הדיגיטלי מבוסס-AI למצוא נכסי נתונים כמו מערכי נתונים של BigQuery, מופעים של Cloud SQL ועוד.

הכלים הבאים זמינים ל-LLM:

אופציונלי: מוסיפים הוראות למערכת

הוראות מערכת הן דרך לספק הנחיות ספציפיות ל-LLM, כדי לעזור לו להבין את ההקשר ולתת תשובות מדויקות יותר. מגדירים הוראות למערכת על סמך הנחיית המערכת המומלצת.

לדוגמה, אפשר להוסיף הוראות שיסבירו למודל ה-LLM איך להשתמש בכלים של Dataplex Universal Catalog:

  • כשמתבקשים למצוא מערכי נתונים או טבלאות, משתמשים בכלי dataplex_search_entries.
  • אם מתבקשים לספק סכימת טבלה או פרטים של מטא-נתונים כמו כללים של איכות הנתונים או בעלות, משתמשים בכלי dataplex_lookup_entry.
  • כשאתם נשאלים על כללי ניהול או סיווגים, כדאי להתחיל להשתמש ב-dataplex_search_aspect_types כדי למצוא סוגי היבטים רלוונטיים.

מידע נוסף על הגדרת ההוראות זמין במאמר בנושא שימוש בהוראות כדי לקבל עריכות מ-AI בהתאם לסגנון התכנות שלכם.

המאמרים הבאים