הדרכה: הפעלת הסקה בטבלת אובייקטים באמצעות מודל סיווג

במדריך הזה נסביר איך ליצור טבלת אובייקטים על סמך תמונות ממערך נתונים ציבורי, ואז להריץ הסקת מסקנות בטבלת האובייקטים הזו באמצעות מודל ResNet 50.

מודל ResNet 50

מודל ResNet 50 מנתח קובצי תמונות ומפיק קבוצה של וקטורים שמייצגים את הסבירות שתמונה מסוימת שייכת לסיווג המתאים (לוגיטים). מידע נוסף זמין בקטע Usage (שימוש) בדף של המודל ב-TensorFlow Hub.

הקלט של מודל ResNet 50 הוא טנסור של DType = float32 בצורה [-1, 224, 224, 3]. הפלט הוא מערך של טנסורים של tf.float32 בצורה [-1, 1024].

ההרשאות הנדרשות

  • כדי ליצור את מערך הנתונים, צריך את ההרשאה bigquery.datasets.create.
  • כדי ליצור את משאב החיבור, צריך את ההרשאות הבאות:

    • bigquery.connections.create
    • bigquery.connections.get
  • כדי להעניק הרשאות לחשבון השירות של החיבור, צריך את ההרשאה הבאה:

    • resourcemanager.projects.setIamPolicy
  • כדי ליצור את טבלת האובייקטים, צריך את ההרשאות הבאות:

    • bigquery.tables.create
    • bigquery.tables.update
    • bigquery.connections.delegate
  • כדי ליצור את הדלי, נדרשת ההרשאה storage.buckets.create.

  • כדי להעלות את המודל ל-Cloud Storage, צריך את ההרשאות storage.objects.create ו-storage.objects.get.

  • כדי לטעון את המודל ל-BigQuery ML, אתם צריכים את ההרשאות הבאות:

    • bigquery.jobs.create
    • bigquery.models.create
    • bigquery.models.getData
    • bigquery.models.updateData
  • כדי להריץ הסקה, אתם צריכים את ההרשאות הבאות:

    • bigquery.tables.getData בטבלת האובייקטים
    • bigquery.models.getData במודל
    • bigquery.jobs.create

עלויות

במסמך הזה משתמשים ברכיבים הבאים של Google Cloud, והשימוש בהם כרוך בתשלום:

  • BigQuery: You incur storage costs for the object table you create in BigQuery.
  • BigQuery ML: You incur costs for the model you create and the inference you perform in BigQuery ML.
  • Cloud Storage: You incur costs for the objects you store in Cloud Storage.

כדי להעריך את ההוצאות בהתאם לתחזית השימוש שלכם, אתם יכולים להיעזר במחשבון העלויות.

משתמשים חדשים של Google Cloud ? יכול להיות שאתם זכאים לתקופת ניסיון בחינם.

מידע נוסף על תמחור האחסון ב-BigQuery זמין במאמר בנושא תמחור האחסון במסמכי BigQuery.

מידע נוסף על התמחור של BigQuery ML זמין במאמר תמחור של BigQuery ML במסמכי BigQuery.

מידע נוסף על התמחור של Cloud Storage זמין בדף התמחור של Cloud Storage.

לפני שמתחילים

  1. נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and BigQuery Connection API APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and BigQuery Connection API APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

יצירת בקשה לשמירת מקום

כדי להשתמש במודל מיובא עם טבלת אובייקטים, צריך ליצור הזמנה שמשתמשת במהדורות Enterprise או Enterprise Plus של BigQuery, ואז ליצור הקצאת הזמנה שמשתמשת בסוג העבודה QUERY.

יצירת מערך נתונים

יצירת מערך נתונים בשם resnet_inference_test:

SQL

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:

    CREATE SCHEMA `PROJECT_ID.resnet_inference_test`;

    מחליפים את PROJECT_ID במזהה הפרויקט.

BQ

  1. במסוף Google Cloud , מפעילים את Cloud Shell.

    הפעלת Cloud Shell

  2. מריצים את הפקודה bq mk כדי ליצור את קבוצת הנתונים:

    bq mk --dataset --location=us PROJECT_ID:resnet_inference_test

    מחליפים את PROJECT_ID במזהה הפרויקט.

יצירת חיבור

יוצרים חיבור בשם lake-connection:

המסוף

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית הימנית, לוחצים על כלי הניתוחים:

    כפתור מודגש לחלונית הסייר.

    אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.

  3. בחלונית Explorer, לוחצים על Add data.

    תיבת הדו-שיח הוספת נתונים נפתחת.

  4. בחלונית Filter By, בקטע Data Source Type, בוחרים באפשרות Databases.

    אפשרות אחרת היא להזין Vertex AI בשדה חיפוש מקורות נתונים.

  5. בקטע מקורות נתונים מומלצים, לוחצים על Vertex AI.

  6. לוחצים על כרטיס הפתרון Vertex AI Models: BigQuery Federation.

  7. ברשימה Connection type בוחרים באפשרות Vertex AI remote models, remote functions, BigLake and Spanner (Cloud Resource).

  8. בשדה מזהה החיבור, מקלידים lake-connection.

  9. לוחצים על יצירת קישור.

  10. בחלונית Connection info, מעתיקים את הערך מהשדה Service account ID ושומרים אותו במקום כלשהו. המידע הזה נדרש כדי להעניק הרשאות לחשבון השירות של החיבור.

BQ

  1. ב-Cloud Shell, מריצים את הפקודה bq mk כדי ליצור את החיבור:

    bq mk --connection --location=us --connection_type=CLOUD_RESOURCE \
    lake-connection
    
  2. מריצים את הפקודה bq show כדי לאחזר מידע על החיבור:

    bq show --connection us.lake-connection
    
  3. מהעמודה properties, מעתיקים את הערך של מאפיין serviceAccountId ושומרים אותו במקום כלשהו. תצטרכו את המידע הזה כדי להעניק הרשאות לחשבון השירות של החיבור.

יצירת קטגוריה של Cloud Storage

יוצרים קטגוריה של Cloud Storage לאחסון קובצי המודל.

מתן הרשאות לחשבון השירות של החיבור

המסוף

  1. עוברים לדף IAM & Admin.

    כניסה לדף IAM & Admin

  2. לוחצים על הענקת גישה.

    תיבת הדו-שיח Add principals נפתחת.

  3. בשדה New principals, מזינים את מזהה חשבון השירות שהעתקתם קודם.

  4. בשדה Select a role, בוחרים באפשרות Cloud Storage ואז באפשרות Storage Object Viewer.

  5. לוחצים על Save.

gcloud

ב-Cloud Shell, מריצים את הפקודה gcloud storage buckets add-iam-policy-binding:

gcloud storage buckets add-iam-policy-binding gs://BUCKET_NAME \
--member=serviceAccount:MEMBER \
--role=roles/storage.objectViewer

מחליפים את MEMBER במזהה של חשבון השירות שהעתקתם קודם. מחליפים את BUCKET_NAME בשם הקטגוריה שיצרתם קודם.

מידע נוסף זמין במאמר בנושא הוספת חשבון משתמש למדיניות ברמת הקטגוריה.

יצירת טבלת אובייקטים

יוצרים טבלת אובייקטים בשם vision_images על סמך קובצי התמונות בקטגוריה הציבורית gs://cloud-samples-data/vision:

SQL

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:

    CREATE EXTERNAL TABLE resnet_inference_test.vision_images
    WITH CONNECTION `us.lake-connection`
    OPTIONS(
      object_metadata = 'SIMPLE',
      uris = ['gs://cloud-samples-data/vision/*.jpg']
    );

BQ

ב-Cloud Shell, מריצים את הפקודה bq mk כדי ליצור את החיבור:

bq mk --table \
--external_table_definition='gs://cloud-samples-data/vision/*.jpg@us.lake-connection' \
--object_metadata=SIMPLE \
resnet_inference_test.vision_images

העלאת המודל ל-Cloud Storage

מקבלים את קובצי המודל ומוודאים שהם זמינים ב-Cloud Storage:

  1. מורידים את מודל ResNet 50 למחשב המקומי. כך תקבלו קובץ saved_model.pb ותיקייה variables עבור המודל.
  2. מעלים את הקובץ saved_model.pb ואת התיקייה variables לקטגוריה שיצרתם קודם.

טעינת המודל ל-BigQuery ML

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:

    CREATE MODEL `resnet_inference_test.resnet`
    OPTIONS(
      model_type = 'TENSORFLOW',
      model_path = 'gs://BUCKET_NAME/*');

    מחליפים את BUCKET_NAME בשם הקטגוריה שיצרתם קודם.

בדיקת המודל

בודקים את המודל שהועלה כדי לראות מהם שדות הקלט והפלט שלו:

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית הימנית, לוחצים על כלי הניתוחים:

    כפתור מודגש לחלונית הסייר.

  3. בחלונית Explorer מרחיבים את הפרויקט, לוחצים על Datasets ואז לוחצים על מערך הנתונים resnet_inference_test.

  4. עוברים לכרטיסייה מודלים.

  5. לוחצים על המודל resnet.

  6. בחלונית המודל שנפתחת, לוחצים על הכרטיסייה סכימה.

  7. בודקים את הקטע Labels (תוויות). כאן מציינים את השדות שהמודל מוציא כפלט. במקרה הזה, הערך של שם השדה הוא activation_49.

  8. מעיינים בקטע תכונות. כך מזהים את השדות שצריך להזין במודל. מפנים אליהם בהצהרה SELECT של הפונקציה ML.DECODE_IMAGE. במקרה הזה, הערך של שם השדה הוא input_1.

הרצת הסקה

מריצים הסקה על טבלת האובייקטים vision_images באמצעות המודל resnet:

  1. עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בחלונית Editor, מריצים את הצהרת ה-SQL הבאה:

    SELECT *
    FROM ML.PREDICT(
      MODEL `resnet_inference_test.resnet`,
      (SELECT uri, ML.RESIZE_IMAGE(ML.DECODE_IMAGE(data), 224, 224, FALSE) AS input_1
      FROM resnet_inference_test.vision_images)
    );

    התוצאות אמורות להיראות כך:

    -------------------------------------------------------------------------------------------------------------------------------------
    | activation_49           | uri                                                                                           | input_1 |
    ------------------------------------------------------------------------------------------------------------------------------------
    | 1.0254175464297077e-07  | gs://cloud-samples-data/vision/automl_classification/flowers/daisy/21652746_cc379e0eea_m.jpg  | 0.0     |
    ------------------------------------------------------------------------------------------------------------------------------------
    | 2.1671139620593749e-06  |                                                                                               | 0.0     |
    --------------------------                                                                                               -----------
    | 8.346052027263795e-08   |                                                                                               | 0.0     |
    --------------------------                                                                                               -----------
    | 1.159310958342985e-08   |                                                                                               | 0.0     |
    ------------------------------------------------------------------------------------------------------------------------------------
    

הסרת המשאבים

  1. במסוף Google Cloud , נכנסים לדף Manage resources.

    כניסה לדף Manage resources

  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על Delete.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.