הדרכה: הרצת הסקה על טבלת אובייקטים באמצעות מודל וקטור תכונות
במדריך הזה נסביר איך ליצור טבלת אובייקטים על סמך התמונות ממערך הנתונים של פרחים, ואז להריץ הסקה על טבלת האובייקטים הזו באמצעות מודל MobileNet V3.
מודל MobileNet V3
מודל MobileNet V3 מנתח קובצי תמונות ומחזיר מערך של וקטור תכונות. מערך וקטור התכונות הוא רשימה של רכיבים מספריים שמתארים את המאפיינים של התמונות שנותחו. כל וקטור תכונות מתאר מרחב תכונות רב-ממדי, ומספק את הקואורדינטות של התמונה במרחב הזה. אתם יכולים להשתמש במידע הווקטורי של תמונה כדי לסווג אותה בצורה נוספת, למשל באמצעות דמיון קוסינוסי כדי לקבץ תמונות דומות.
הקלט של מודל MobileNet V3 הוא טנסור של DType
tf.float32 בצורה [-1, 224, 224, 3]. הפלט הוא מערך של טנסורים של tf.float32 בצורה [-1, 1024].
ההרשאות הנדרשות
- כדי ליצור את מערך הנתונים, צריך את ההרשאה
bigquery.datasets.create. כדי ליצור את משאב החיבור, צריך את ההרשאות הבאות:
bigquery.connections.createbigquery.connections.get
כדי להעניק הרשאות לחשבון השירות של החיבור, צריך את ההרשאה הבאה:
resourcemanager.projects.setIamPolicy
כדי ליצור את טבלת האובייקטים, צריך את ההרשאות הבאות:
bigquery.tables.createbigquery.tables.updatebigquery.connections.delegate
כדי ליצור את הדלי, נדרשת ההרשאה
storage.buckets.create.כדי להעלות את מערך הנתונים והמודל ל-Cloud Storage, צריך את ההרשאות
storage.objects.createו-storage.objects.get.כדי לטעון את המודל ל-BigQuery ML, אתם צריכים את ההרשאות הבאות:
bigquery.jobs.createbigquery.models.createbigquery.models.getDatabigquery.models.updateData
כדי להריץ הסקה, אתם צריכים את ההרשאות הבאות:
bigquery.tables.getDataבטבלת האובייקטיםbigquery.models.getDataבמודלbigquery.jobs.create
עלויות
במסמך הזה משתמשים ברכיבים הבאים של Google Cloud, והשימוש בהם כרוך בתשלום:
- BigQuery: You incur storage costs for the object table you create in BigQuery.
- BigQuery ML: You incur costs for the model you create and the inference you perform in BigQuery ML.
- Cloud Storage: You incur costs for the objects you store in Cloud Storage.
כדי להעריך את ההוצאות בהתאם לתחזית השימוש שלכם, אתם יכולים להיעזר במחשבון העלויות.
מידע נוסף על תמחור האחסון ב-BigQuery זמין במאמר בנושא תמחור האחסון במסמכי BigQuery.
מידע נוסף על התמחור של BigQuery ML זמין במאמר תמחור של BigQuery ML במסמכי BigQuery.
מידע נוסף על התמחור של Cloud Storage זמין בדף התמחור של Cloud Storage.
לפני שמתחילים
- נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and BigQuery Connection API APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and BigQuery Connection API APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
יצירת בקשה לשמירת מקום
כדי להשתמש במודל מיובא עם טבלת אובייקטים, צריך ליצור הזמנה שמשתמשת במהדורות Enterprise או Enterprise Plus של BigQuery, ואז ליצור הקצאת הזמנה שמשתמשת בסוג העבודה QUERY.
יצירת מערך נתונים
יצירת מערך נתונים בשם mobilenet_inference_test:
SQL
עוברים לדף BigQuery.
בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:
CREATE SCHEMA `PROJECT_ID.mobilenet_inference_test`;
מחליפים את
PROJECT_IDבמזהה הפרויקט.
BQ
במסוף Google Cloud , מפעילים את Cloud Shell.
מריצים את הפקודה
bq mkכדי ליצור את קבוצת הנתונים:bq mk --dataset --location=us PROJECT_ID:resnet_inference_test
מחליפים את
PROJECT_IDבמזהה הפרויקט.
יצירת חיבור
יוצרים חיבור בשם lake-connection:
המסוף
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.
בחלונית Explorer, לוחצים על Add data.
תיבת הדו-שיח הוספת נתונים נפתחת.
בחלונית Filter By, בקטע Data Source Type, בוחרים באפשרות Databases.
אפשרות אחרת היא להזין
Vertex AIבשדה חיפוש מקורות נתונים.בקטע מקורות נתונים מומלצים, לוחצים על Vertex AI.
לוחצים על כרטיס הפתרון Vertex AI Models: BigQuery Federation.
ברשימה Connection type בוחרים באפשרות Vertex AI remote models, remote functions, BigLake and Spanner (Cloud Resource).
בשדה מזהה החיבור, מקלידים
lake-connection.לוחצים על יצירת קישור.
בחלונית Explorer מרחיבים את הפרויקט, לוחצים על Connections ובוחרים את החיבור
us.lake-connection.בחלונית Connection info, מעתיקים את הערך מהשדה Service account ID. תצטרכו את הפרטים האלה כדי להעניק הרשאה לחשבון השירות של החיבור בקטגוריה של Cloud Storage שתיצרו בשלב הבא.
BQ
ב-Cloud Shell, מריצים את הפקודה
bq mkכדי ליצור את החיבור:bq mk --connection --location=us --connection_type=CLOUD_RESOURCE \ lake-connectionמריצים את הפקודה
bq showכדי לאחזר מידע על החיבור:bq show --connection us.lake-connectionמהעמודה
properties, מעתיקים את הערך של מאפייןserviceAccountIdושומרים אותו במקום כלשהו. תצטרכו את המידע הזה כדי להעניק הרשאות לחשבון השירות של החיבור.
יצירת קטגוריה של Cloud Storage
- יצירת קטגוריה של Cloud Storage
- יוצרים שתי תיקיות בדלי, אחת בשם
mobilenetלקובצי המודל ואחת בשםflowersלמערך הנתונים.
מתן הרשאות לחשבון השירות של החיבור
המסוף
עוברים לדף IAM & Admin.
לוחצים על הענקת גישה.
תיבת הדו-שיח Add principals נפתחת.
בשדה New principals, מזינים את מזהה חשבון השירות שהעתקתם קודם.
בשדה Select a role, בוחרים באפשרות Cloud Storage ואז באפשרות Storage Object Viewer.
לוחצים על Save.
gcloud
ב-Cloud Shell, מריצים את הפקודה gcloud storage buckets add-iam-policy-binding:
gcloud storage buckets add-iam-policy-binding gs://BUCKET_NAME \ --member=serviceAccount:MEMBER \ --role=roles/storage.objectViewer
מחליפים את MEMBER במזהה של חשבון השירות שהעתקתם קודם. מחליפים את BUCKET_NAME בשם הקטגוריה שיצרתם קודם.
מידע נוסף זמין במאמר בנושא הוספת חשבון משתמש למדיניות ברמת הקטגוריה.
העלאת מערך הנתונים ל-Cloud Storage
מקבלים את קובצי מערך הנתונים ומוודאים שהם זמינים ב-Cloud Storage:
- מורידים את מערך הנתונים של הפרחים למחשב המקומי.
- מבטלים את דחיסת הקובץ
flower_photos.tgz. - מעלים את התיקייה
flower_photosלתיקייהflowersבקטגוריה שיצרתם קודם. - אחרי שההעלאה מסתיימת, מוחקים את הקובץ
LICENSE.txtבתיקייהflower_photos.
יצירת טבלת אובייקטים
יוצרים טבלת אובייקטים בשם sample_images על סמך מערך הנתונים flowers שהעליתם:
SQL
עוברים לדף BigQuery.
בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:
CREATE EXTERNAL TABLE mobilenet_inference_test.sample_images WITH CONNECTION `us.lake-connection` OPTIONS( object_metadata = 'SIMPLE', uris = ['gs://BUCKET_NAME/flowers/*']);
מחליפים את
BUCKET_NAMEבשם הקטגוריה שיצרתם קודם.
BQ
ב-Cloud Shell, מריצים את הפקודה bq mk כדי ליצור את החיבור:
bq mk --table \ --external_table_definition='gs://BUCKET_NAME/flowers/*@us.lake-connection' \ --object_metadata=SIMPLE \ mobilenet_inference_test.sample_images
מחליפים את BUCKET_NAME בשם הקטגוריה שיצרתם קודם.
העלאת המודל ל-Cloud Storage
מקבלים את קובצי המודל ומוודאים שהם זמינים ב-Cloud Storage:
- מורידים את מודל MobileNet V3 למחשב המקומי. כך תקבלו קובץ
saved_model.pbותיקייהvariablesעבור המודל. - מעלים את הקובץ
saved_model.pbואת התיקייהvariablesלתיקייהmobilenetבקטגוריה שיצרתם קודם.
טעינת המודל ל-BigQuery ML
עוברים לדף BigQuery.
בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:
CREATE MODEL `mobilenet_inference_test.mobilenet` OPTIONS( model_type = 'TENSORFLOW', model_path = 'gs://BUCKET_NAME/mobilenet/*');
מחליפים את
BUCKET_NAMEבשם הקטגוריה שיצרתם קודם.
בדיקת המודל
בודקים את המודל שהועלה כדי לראות מהם שדות הקלט והפלט שלו:
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

בחלונית Explorer מרחיבים את הפרויקט, לוחצים על Datasets ואז לוחצים על מערך הנתונים
mobilenet_inference_test.עוברים לכרטיסייה מודלים.
לוחצים על המודל
mobilenet.בחלונית המודל שנפתחת, לוחצים על הכרטיסייה סכימה.
בודקים את הקטע Labels (תוויות). כאן מציינים את השדות שהמודל מוציא כפלט. במקרה הזה, הערך של שם השדה הוא
feature_vector.מעיינים בקטע תכונות. כך מזהים את השדות שצריך להזין במודל. מפנים אליהם בהצהרה
SELECTשל הפונקציהML.DECODE_IMAGE. במקרה הזה, הערך של שם השדה הואinputs.
הרצת הסקה
מריצים הסקה על טבלת האובייקטים sample_images באמצעות המודל mobilenet:
עוברים לדף BigQuery.
בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:
SELECT * FROM ML.PREDICT( MODEL `mobilenet_inference_test.mobilenet`, (SELECT uri, ML.RESIZE_IMAGE(ML.DECODE_IMAGE(data), 224, 224, FALSE) AS inputs FROM mobilenet_inference_test.sample_images) );
התוצאות אמורות להיראות כך:
-------------------------------------------------------------------------------------------------------------- | feature_vector | uri | inputs | —------------------------------------------------------------------------------------------------------------- | 0.850297749042511 | gs://mybucket/flowers/dandelion/3844111216_742ea491a0.jpg | 0.29019609093666077 | —------------------------------------------------------------------------------------------------------------- | -0.27427938580513 | | 0.31372550129890442 | —------------------------- ------------------------ | -0.23189745843410492 | | 0.039215687662363052 | —------------------------- ------------------------ | -0.058292809873819351 | | 0.29985997080802917 | —-------------------------------------------------------------------------------------------------------------
הסרת המשאבים
- במסוף Google Cloud , נכנסים לדף Manage resources.
- ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על Delete.
- כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.