שימוש בתאי SQL
במדריך הזה מוסבר איך להשתמש בתאי SQL כדי לשלוח שאילתות לנתונים מתוך מחברת Colab Enterprise.
סקירה כללית
תא SQL הוא תא קוד שבו אפשר לכתוב, לערוך ולהריץ שאילתות SQL מתוך מחברת Colab Enterprise. תאי SQL מספקים תהליך עבודה חלופי ל-IPython Magics for BigQuery.
יכולות
תאי SQL מספקים את היכולות הבאות:
- תמיכה בהרצה יבשה: אימות של הצהרת SQL ואומדן של מספר הבייטים שעובדו על ידי השאילתה
- עיצוב: בדיקת תקינות של מילות מפתח והדגשת תחביר
- מתן שמות למשתני הפלט של BigQuery DataFrame: הפניה למשתנה הפלט מתוך תאים אחרים במחברת
- החלפת משתנים: אפשר להשתמש במשתני Python ובתאי SQL כדי לתמוך בהגדרת פרמטרים ובאפשרות לשאול שאילתות על התוצאות של שאילתה קודמת
- כלי לצפייה בתוצאות: כלי קל משקל לצפייה בתוצאות בטבלה עם חלוקה לדפים עבור קבוצות גדולות של תוצאות
- שילוב של תא ויזואליזציה: אפשר להשתמש בפלט מתא SQL כקלט לתא ויזואליזציה
דיאלקט SQL ומקור נתונים נתמכים
תאי SQL ב-Colab Enterprise תומכים ב-GoogleSQL.
אפשר להריץ שאילתות SQL על נתוני BigQuery.
מגבלות
כשמתכננים את הפרויקט, חשוב לקחת בחשבון את המגבלות הבאות:
- אפשר להריץ כמה הצהרות SQL בתא SQL אחד, אבל רק התוצאות של הצהרת ה-SQL האחרונה נשמרות ב-DataFrame.
לפני שמתחילים
- נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Compute Engine, Dataform, and Agent Platform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Compute Engine, Dataform, and Agent Platform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות ליצירת מחברת Colab Enterprise, להרצת קוד המחברת בסביבת זמן ריצה ולשימוש בנתוני BigQuery במחברת, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:
- BigQuery User (
roles/bigquery.user) - משתמש Colab Enterprise (
roles/aiplatform.colabEnterpriseUser)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
יצירת תא SQL
כדי ליצור תא SQL ב-Colab Enterprise:
-
נכנסים לדף My notebooks של Colab Enterprise במסוף Google Cloud .
-
בתפריט Region (אזור), בוחרים את האזור שבו נמצא ה-Notebook.
-
לוחצים על ה-Notebook שרוצים לפתוח. אם עדיין לא יצרתם מחברת, יוצרים מחברת.
-
בסרגל הכלים, כדי להוסיף תא SQL, לוחצים על התפריט אפשרויות להוספת תא קוד ובוחרים באפשרות הוספת תא SQL.
תא ה-SQL יתווסף ל-Notebook.
הזנה והרצה של שאילתה
-
בתא ה-SQL, מזינים שאילתת SQL. סקירה כללית של משפטי SQL ודיאלקטים נתמכים זמינה במאמר מבוא ל-SQL ב-BigQuery.
אפשר להפנות למשתני Python בביטויים על ידי הוספת שם המשתנה בסוגריים מסולסלים (
{ }). לדוגמה, אם ציינתם ערך במשתנה Python בשםmy_threshold, תוכלו להגביל את קבוצת התוצאות באמצעות שאילתה שדומה לזו:SELECT * FROM my_dataset.my_table WHERE x > {my_threshold};
-
מציבים את הסמן מעל תא ה-SQL שרוצים להריץ, ואז לוחצים על הלחצן הפעלת התא.
הפלט של השאילתה נשמר אוטומטית כ-DataFrame ב-BigQuery עם אותו שם כמו הכותרת של תא ה-SQL.
אינטראקציה עם קבוצת התוצאות
אפשר ליצור אינטראקציה עם קבוצת התוצאות כ-DataFrame של BigQuery או כ-DataFrame של pandas.
אפשר לשרשר הצהרות SQL באמצעות אותו שם משתנה של תא SQL. לדוגמה, אפשר להשתמש ב-BigQuery DataFrames שנוצרו על ידי קבוצת התוצאות כטבלאות בשאילתה הבאה, על ידי הוספת שם ה-DataFrame בסוגריים מסולסלים ({ }). אפשר לראות את הדוגמה הבאה, שמתייחסת לפלט של שאילתה קודמת שנשמר כ-DataFrame בשם df:
SELECT * FROM {df};