שימוש בתאי SQL

במדריך הזה מוסבר איך להשתמש בתאי SQL כדי לשלוח שאילתות לנתונים מתוך מחברת Colab Enterprise.

סקירה כללית

תא SQL הוא תא קוד שבו אפשר לכתוב, לערוך ולהריץ שאילתות SQL מתוך מחברת Colab Enterprise. תאי SQL מספקים תהליך עבודה חלופי ל-IPython Magics for BigQuery.

יכולות

תאי SQL מספקים את היכולות הבאות:

  • תמיכה בהרצה יבשה: אימות של הצהרת SQL ואומדן של מספר הבייטים שעובדו על ידי השאילתה
  • עיצוב: בדיקת תקינות של מילות מפתח והדגשת תחביר
  • מתן שמות למשתני הפלט של BigQuery DataFrame: הפניה למשתנה הפלט מתוך תאים אחרים במחברת
  • החלפת משתנים: אפשר להשתמש במשתני Python ובתאי SQL כדי לתמוך בהגדרת פרמטרים ובאפשרות לשאול שאילתות על התוצאות של שאילתה קודמת
  • כלי לצפייה בתוצאות: כלי קל משקל לצפייה בתוצאות בטבלה עם חלוקה לדפים עבור קבוצות גדולות של תוצאות
  • שילוב של תא ויזואליזציה: אפשר להשתמש בפלט מתא SQL כקלט לתא ויזואליזציה

דיאלקט SQL ומקור נתונים נתמכים

  • תאי SQL ב-Colab Enterprise תומכים ב-GoogleSQL.

  • אפשר להריץ שאילתות SQL על נתוני BigQuery.

מגבלות

כשמתכננים את הפרויקט, חשוב לקחת בחשבון את המגבלות הבאות:

  • אפשר להריץ כמה הצהרות SQL בתא SQL אחד, אבל רק התוצאות של הצהרת ה-SQL האחרונה נשמרות ב-DataFrame.

לפני שמתחילים

  1. נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery, Compute Engine, Dataform, and Agent Platform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery, Compute Engine, Dataform, and Agent Platform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות ליצירת מחברת Colab Enterprise, להרצת קוד המחברת בסביבת זמן ריצה ולשימוש בנתוני BigQuery במחברת, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.

יצירת תא SQL

כדי ליצור תא SQL ב-Colab Enterprise:

  1. נכנסים לדף My notebooks של Colab Enterprise במסוף Google Cloud .

    לתיקיות שלי

  2. בתפריט Region (אזור), בוחרים את האזור שבו נמצא ה-Notebook.

  3. לוחצים על ה-Notebook שרוצים לפתוח. אם עדיין לא יצרתם מחברת, יוצרים מחברת.

  4. בסרגל הכלים, כדי להוסיף תא SQL, לוחצים על התפריט  אפשרויות להוספת תא קוד ובוחרים באפשרות הוספת תא SQL.

    תא ה-SQL יתווסף ל-Notebook.

הזנה והרצה של שאילתה

  1. בתא ה-SQL, מזינים שאילתת SQL. סקירה כללית של משפטי SQL ודיאלקטים נתמכים זמינה במאמר מבוא ל-SQL ב-BigQuery.

    אפשר להפנות למשתני Python בביטויים על ידי הוספת שם המשתנה בסוגריים מסולסלים ({ }). לדוגמה, אם ציינתם ערך במשתנה Python בשם my_threshold, תוכלו להגביל את קבוצת התוצאות באמצעות שאילתה שדומה לזו:

    SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
        
  2. מציבים את הסמן מעל תא ה-SQL שרוצים להריץ, ואז לוחצים על הלחצן  הפעלת התא.

הפלט של השאילתה נשמר אוטומטית כ-DataFrame ב-BigQuery עם אותו שם כמו הכותרת של תא ה-SQL.

אינטראקציה עם קבוצת התוצאות

אפשר ליצור אינטראקציה עם קבוצת התוצאות כ-DataFrame של BigQuery או כ-DataFrame של pandas.

אפשר לשרשר הצהרות SQL באמצעות אותו שם משתנה של תא SQL. לדוגמה, אפשר להשתמש ב-BigQuery DataFrames שנוצרו על ידי קבוצת התוצאות כטבלאות בשאילתה הבאה, על ידי הוספת שם ה-DataFrame בסוגריים מסולסלים ({ }). אפשר לראות את הדוגמה הבאה, שמתייחסת לפלט של שאילתה קודמת שנשמר כ-DataFrame בשם df:

SELECT * FROM {df};

המאמרים הבאים