ייצוא נתונים באמצעות Data Boost

בדף הזה מוסבר איך להשתמש ב-Spanner Data Boost כדי לייצא נתונים מ-Spanner עם השפעה כמעט אפסית על עומסי העבודה הקיימים במופע Spanner שהוקצה.

מידע נוסף על Data Boost

אפשר לייצא נתונים באמצעות הדף Export data במסוף Spanner, או באמצעות תבנית Dataflow.

לפני שמתחילים

כדאי לוודא שיש לכם הרשאה לניהול זהויות והרשאות גישה (IAM) spanner.databases.useDataBoost. מידע נוסף זמין במאמר בקרת גישה באמצעות IAM.

ייצוא נתונים באמצעות מסוף Spanner

כדי לייצא נתונים בפורמט Avro באמצעות מסוף Spanner:

  1. פועלים לפי ההוראות במאמר ייצוא מסדי נתונים מ-Spanner ל-Avro.

  2. מסמנים את תיבת הסימון שימוש ב-Spanner Data Boost.

כדי לייצא נתונים בפורמט CSV:

ייצוא נתונים באמצעות תבניות Dataflow

כדי להפעיל ייצוא של Dataflow עם Data Boost, בוחרים אחת מהאפשרויות הבאות:

המסוף

  1. עוברים לאחד מהדפים הבאים:

  2. פועלים לפי ההוראות לשימוש ב-Console בקטע הפעלת התבנית.

  3. בדף Create job from template, בקטע Optional parameters, מזינים true בשדה Use Spanner Data Boost.

‫CLI של gcloud

  1. עוברים לאחד מהדפים הבאים:

  2. פועלים לפי ההוראות של gloud בקטע הפעלת התבנית.

  3. מוסיפים את הפרמטר הבא לפקודה:

    dataBoostEnabled=true
    

    בדוגמה הבאה מריצים את תבנית Spanner ל-Cloud Storage Avro ומציינים את השימוש ב-Data Boost.

    gcloud dataflow jobs run my_export_job \
    --gcs-location gs://dataflow-templates/latest/Cloud_Spanner_to_GCS_Avro \
    --region us-central1 \
    --staging-location gs://mybucket/temp \
    --parameters \
    instanceId=my_instance,\
    databaseId=my_database,\
    outputDir=gs://mybucket/export \
    dataBoostEnabled=true

המאמרים הבאים