מטרות
במדריך הזה נסביר איך לבצע את השלבים הבאים באמצעות ספריית הלקוח Spanner ל-C++:
- יוצרים מכונה ומסד נתונים ב-Spanner.
- לכתוב, לקרוא ולהריץ שאילתות SQL על נתונים במסד הנתונים.
- מעדכנים את הסכימה של מסד הנתונים.
- עדכון נתונים באמצעות טרנזקציה של קריאה וכתיבה.
- מוסיפים אינדקס משני למסד הנתונים.
- השימוש באינדקס מאפשר לקרוא ולהריץ שאילתות SQL על נתונים.
- אחזור נתונים באמצעות טרנזקציה לקריאה בלבד.
עלויות
במדריך הזה נעשה שימוש ב-Spanner, שהוא רכיב בתשלום שלGoogle Cloud. מידע על עלות השימוש ב-Spanner מופיע בקטע תמחור.
לפני שמתחילים
צריך לבצע את השלבים שמפורטים במאמר הגדרה, שכוללים יצירה והגדרה של פרויקט ברירת מחדל Google Cloud , הפעלת החיוב, הפעלת Cloud Spanner API והגדרת OAuth 2.0 כדי לקבל אישורי אימות לשימוש ב-Cloud Spanner API.
בפרט, חשוב להריץ את הפקודה gcloud auth
application-default login כדי להגדיר את סביבת הפיתוח המקומית עם פרטי אימות.
הכנת סביבת C++ מקומית
משכפלים את מאגר האפליקציה לדוגמה ומעבירים אותו למכונה המקומית:
git clone https://github.com/googleapis/google-cloud-cpp $HOME/google-cloud-cppכדי להתקין את Bazel ל-Linux, צריך לפעול לפי ההוראות האלה.
עוברים לספרייה שמכילה את הקוד לדוגמה של Spanner:
cd $HOME/google-cloud-cppמריצים את הפקודה הבאה כדי ליצור את הדוגמאות:
bazel build //google/cloud/spanner/samples:samplesמגדירים אימות והרשאה עבור הפרויקט
google-cloud-cpp.gcloud auth application-default loginיוצרים משתנה סביבה בשם
PROJECT_ID. מחליפים את [MY_PROJECT_ID] במזהה הפרויקט ב- Google Cloud . אפשר למצוא את המזהה הזה בדף Welcome של הפרויקט.export PROJECT_ID=[MY_PROJECT_ID]
יצירת מופע
בפעם הראשונה שמשתמשים ב-Spanner, צריך ליצור מופע, שהוא הקצאה של משאבים שמשמשים מסדי נתונים של Spanner. כשיוצרים מופע, בוחרים הגדרת מופע, שקובעת איפה הנתונים מאוחסנים, וגם את מספר הצמתים לשימוש, שקובע את כמות משאבי ההגשה והאחסון במופע.
במאמר יצירת מכונה מוסבר איך ליצור מכונת Spanner באמצעות אחת מהשיטות הבאות. אפשר לתת למופע שם test-instance כדי להשתמש בו עם נושאים אחרים במסמך הזה שמפנים למופע בשם test-instance.
- Google Cloud CLI
- מסוף Google Cloud
- ספריית לקוח (C++, C#, Go, Java, Node.js, PHP, Python או Ruby)
עיון בקבצים לדוגמה
מאגר הדוגמאות מכיל דוגמה שמראה איך להשתמש ב-Spanner עם C++.
אפשר לעיין בקובץ google/cloud/spanner/samples/samples.cc כדי לראות איך יוצרים מסד נתונים ומשנים את הסכימה שלו. הנתונים משתמשים בסכימה לדוגמה שמוצגת בדף סכימה ומודל נתונים.
יצירת מסד נתונים
GoogleSQL
bazel run //google/cloud/spanner/samples:samples -- \
create-database PROJECT_ID test-instance example-db
PostgreSQL
bazel run //google/cloud/spanner/samples:postgresql_samples -- \
create-database PROJECT_ID test-instance example-db
bazel run //google/cloud/spanner/samples:postgresql_samples -- \
interleaved-table PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
Created database [projects/${PROJECT_ID}/instances/test-instance/databases/example-db]
GoogleSQL
PostgreSQL
בניב PostgreSQL, צריך ליצור את מסד הנתונים לפני ששולחים בקשת DDL ליצירת טבלה.
בדוגמה הבאה נוצר מסד נתונים:
בדוגמה הבאה נוצרות שתי הטבלאות במסד הנתונים:
השלב הבא הוא כתיבת נתונים למסד הנתונים.
יצירת לקוח מסד נתונים
לפני שתוכלו לבצע פעולות קריאה או כתיבה, אתם צריכים ליצור Client:
Client מאפשר לכם לקרוא, לכתוב, לשלוח שאילתות ולבצע עסקאות במסד נתונים של Spanner. בדרך כלל יוצרים Client כשמפעילים את האפליקציה, ואז משתמשים שוב באותו Client כדי לקרוא, לכתוב ולהריץ עסקאות. כל לקוח משתמש במשאבים ב-Spanner. ה-destructor של Client מנקה אוטומטית את המשאבים של Client, כולל חיבורים לרשת.
מידע נוסף על Client זמין בGoogle Cloud Spanner C++ Reference.
כתיבת נתונים באמצעות DML
אפשר להוסיף נתונים באמצעות שפת טיפול בנתונים (DML) בעסקת קריאה-כתיבה.
משתמשים בפונקציה Client::ExecuteDml() כדי להריץ פקודת DML.
מריצים את הדוגמה באמצעות הארגומנט getting-started-insert.
bazel run //google/cloud/spanner/samples:samples -- \
getting-started-insert PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
Insert was successful [spanner_dml_getting_started_insert]
כתיבת נתונים באמצעות מוטציות
אפשר גם להוסיף נתונים באמצעות מוטציות.
כותבים נתונים באמצעות אובייקט Client. הפונקציה Client::Commit()יוצרת טרנזקציה ומבצעת אותה עבור פעולות כתיבה שמתבצעות באופן אטומי בנקודה לוגית אחת בזמן, בעמודות, בשורות ובטבלאות במסד נתונים.
בדוגמה הבאה אפשר לראות איך לכתוב את הנתונים באמצעות מוטציות:
מריצים את הדוגמה באמצעות הארגומנט insert-data.
bazel run //google/cloud/spanner/samples:samples -- \
insert-data PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
Insert was successful [spanner_insert_data]
הרצת שאילתות על נתונים באמצעות SQL
Spanner תומך בממשק SQL לקריאת נתונים, שאפשר לגשת אליו בשורת הפקודה באמצעות Google Cloud CLI או באופן פרוגרמטי באמצעות ספריית הלקוח של Spanner ל-C++.
בשורת הפקודה
מריצים את הצהרת ה-SQL הבאה כדי לקרוא את הערכים של כל העמודות מהטבלה Albums:
gcloud spanner databases execute-sql example-db --instance=test-instance \
--sql='SELECT SingerId, AlbumId, AlbumTitle FROM Albums'
התוצאה:
SingerId AlbumId AlbumTitle
1 1 Total Junk
1 2 Go, Go, Go
2 1 Green
2 2 Forever Hold Your Peace
2 3 Terrified
שימוש בספריית הלקוח של Spanner עבור C++
בנוסף להרצת הצהרת SQL בשורת הפקודה, אפשר להנפיק את אותה הצהרת SQL באופן פרוגרמטי באמצעות ספריית הלקוח Spanner ל-C++.
משתמשים בפונקציה Client::ExecuteQuery() כדי להריץ את שאילתת ה-SQL.
כך מריצים את השאילתה וניגשים לנתונים:
מריצים את הדוגמה באמצעות הארגומנט query_data.
bazel run //google/cloud/spanner/samples:samples -- \
query-data PROJECT_ID test-instance example-db
אמורה להתקבל התוצאה הבאה:
SingerId: 1 LastName: Richards
SingerId: 2 LastName: Smith
SingerId: 3 LastName: Trentor
SingerId: 4 LastName: Martin
SingerId: 5 LastName: Lomond
SingerId: 12 LastName: Garcia
SingerId: 13 LastName: Morales
SingerId: 14 LastName: Long
SingerId: 15 LastName: Shaw
שאילתה באמצעות פרמטר SQL
אם באפליקציה יש שאילתה שמופעלת לעיתים קרובות, אפשר לשפר את הביצועים שלה על ידי שימוש בפרמטרים. אפשר לשמור במטמון את השאילתה הפרמטרית שמתקבלת ולעשות בה שימוש חוזר, וכך להפחית את עלויות הקומפילציה. מידע נוסף זמין במאמר שימוש בפרמטרים של שאילתות כדי להריץ במהירות שאילתות שמופעלות לעיתים קרובות.
הנה דוגמה לשימוש בפרמטר בקטע WHERE כדי לשלוח שאילתה לגבי רשומות שמכילות ערך ספציפי של LastName.
GoogleSQL
PostgreSQL
מריצים את הדוגמה באמצעות הפקודה query-with-parameter.
bazel run //google/cloud/spanner/samples:samples -- \
query-with-parameter PROJECT_ID test-instance example-db
אמורה להתקבל התוצאה הבאה:
SingerId: 12 FirstName: Melissa LastName: Garcia
קריאת נתונים באמצעות read API
בנוסף לממשק ה-SQL של Spanner, Spanner תומך גם בממשק קריאה.
משתמשים בפונקציה Client::Read() כדי לקרוא שורות ממסד הנתונים. אפשר להשתמש באובייקט KeySet כדי להגדיר אוסף של מפתחות וטווחים של מפתחות לקריאה.
כך קוראים את הנתונים:
מריצים את הדוגמה באמצעות הארגומנט read-data.
bazel run //google/cloud/spanner/samples:samples -- \
read-data PROJECT_ID test-instance example-db
הפלט אמור להיראות כך:
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
עדכון הסכימה של מסד הנתונים
נניח שאתם רוצים להוסיף עמודה חדשה בשם MarketingBudget לטבלה Albums. כדי להוסיף עמודה חדשה לטבלה קיימת, צריך לעדכן את סכימת מסד הנתונים. מערכת Spanner תומכת בעדכוני סכימה במסד נתונים בזמן שמסד הנתונים ממשיך לשרת תנועה. עדכוני סכימה לא מחייבים להעביר את מסד הנתונים למצב אופליין, והם לא נועלים טבלאות או עמודות שלמות. אתם יכולים להמשיך לכתוב נתונים למסד הנתונים במהלך עדכון הסכימה. מידע נוסף על עדכוני סכימה נתמכים ועל ביצועים של שינויים בסכימה זמין במאמר ביצוע עדכונים בסכימה.
הוספת עמודה
אפשר להוסיף עמודה בשורת הפקודה באמצעות Google Cloud CLI או באופן פרוגרמטי באמצעות ספריית הלקוח של Spanner עבור ++C.
בשורת הפקודה
כדי להוסיף את העמודה החדשה לטבלה, משתמשים בפקודה ALTER TABLE הבאה:
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget INT64'
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget BIGINT'
הפרטים שמוצגים הם:
Schema updating...done.
שימוש בספריית הלקוח של Spanner עבור C++
כדי לשנות את הסכימה, משתמשים בפונקציה DatabaseAdminClient::UpdateDatabase().
GoogleSQL
PostgreSQL
מריצים את הדוגמה באמצעות הפקודה add-column.
bazel run //google/cloud/spanner/samples:samples -- \
add-column PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
Added MarketingBudget column
כתיבת נתונים בעמודה החדשה
הקוד הבא כותב נתונים בעמודה החדשה. הפונקציה מגדירה את MarketingBudget ל-100000 בשורה עם מפתח Albums(1, 1), ול-500000 בשורה עם מפתח Albums(2, 2).
מריצים את הדוגמה באמצעות הארגומנט update-data.
bazel run //google/cloud/spanner/samples:samples -- \
update-data PROJECT_ID test-instance example-db
אפשר גם להריץ שאילתת SQL או קריאת נתונים כדי לאחזר את הערכים שזה עתה כתבתם.
הנה הקוד להרצת השאילתה:
כדי להריץ את השאילתה הזו, מריצים את הדוגמה באמצעות הארגומנט query-new-column.
bazel run //google/cloud/spanner/samples:samples -- \
query-new-column PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
SingerId: 1 AlbumId: 1 MarketingBudget: 100000
SingerId: 1 AlbumId: 2 MarketingBudget: NULL
SingerId: 2 AlbumId: 1 MarketingBudget: NULL
SingerId: 2 AlbumId: 2 MarketingBudget: 500000
SingerId: 2 AlbumId: 3 MarketingBudget: NULL
עדכון נתונים
אפשר לעדכן נתונים באמצעות DML בעסקת קריאה-כתיבה.
משתמשים בפונקציה Client::ExecuteDml() כדי להריץ פקודת DML.
GoogleSQL
PostgreSQL
מריצים את הדוגמה באמצעות הארגומנט getting-started-update.
bazel run //google/cloud/spanner/samples:samples -- \
getting-started-update PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
Update was successful [spanner_dml_getting_started_update]
שימוש באינדקס משני
נניח שרוצים לאחזר את כל השורות של Albums שיש להן ערכים של AlbumTitle בטווח מסוים. אפשר לקרוא את כל הערכים מהעמודה AlbumTitle באמצעות הצהרת SQL או קריאת קובץ, ואז להשליך את השורות שלא עומדות בקריטריונים. אבל סריקה מלאה של הטבלה היא פעולה יקרה, במיוחד בטבלאות עם הרבה שורות. במקום זאת, אפשר להאיץ את אחזור השורות כשמחפשים לפי עמודות שאינן מפתח ראשי, על ידי יצירת אינדקס משני בטבלה.
כדי להוסיף אינדקס משני לטבלה קיימת, צריך לעדכן את הסכימה. בדומה לעדכוני סכימה אחרים, Spanner תומך בהוספת אינדקס בזמן שהמסד נתונים ממשיך להעביר תנועה. Spanner ממלא באופן אוטומטי את האינדקס בנתונים הקיימים. יכול להיות שיחלפו כמה דקות עד שהמילוי יסתיים, אבל לא צריך להעביר את מסד הנתונים למצב אופליין או להימנע מכתיבה לטבלה המאונדקסת במהלך התהליך הזה. פרטים נוספים זמינים במאמר בנושא הוספת אינדקס משני.
אחרי שמוסיפים אינדקס משני, Spanner משתמש בו באופן אוטומטי לשאילתות SQL שסביר שיפעלו מהר יותר עם האינדקס. אם משתמשים בממשק הקריאה, צריך לציין את האינדקס שרוצים להשתמש בו.
הוספת אינדקס משני
אפשר להוסיף אינדקס בשורת הפקודה באמצעות ה-CLI של gcloud או באופן פרוגרמטי באמצעות ספריית הלקוח של Spanner ל-C++.
בשורת הפקודה
משתמשים בפקודה CREATE INDEX הבאה כדי להוסיף אינדקס למסד הנתונים:
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle)'
הפרטים שמוצגים הם:
Schema updating...done.
שימוש בספריית הלקוח של Spanner עבור C++
משתמשים בפונקציה DatabaseAdminClient::UpdateDatabase() כדי להוסיף אינדקס:
מריצים את הדוגמה באמצעות הארגומנט add-index.
bazel run //google/cloud/spanner/samples:samples -- \
add-index PROJECT_ID test-instance example-db
הוספת אינדקס יכולה להימשך כמה דקות. אחרי שהאינדקס נוסף, אמור להופיע פלט שדומה לזה:
`AlbumsByAlbumTitle` Index successfully added, new DDL:
database: "projects/PROJECT_ID/instances/test-instance/databases/example-db"
statements: "CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle)"
commit_timestamps {
seconds: 1581011550
nanos: 531102000
}
קריאה באמצעות האינדקס
בשאילתות SQL, Spanner משתמש באופן אוטומטי באינדקס מתאים. בממשק הקריאה, צריך לציין את האינדקס בבקשה.
כדי להשתמש באינדקס בממשק הקריאה, צריך להשתמש בפונקציה Client::Read(), שקוראת אפס או יותר שורות ממסד נתונים באמצעות אינדקס.
הקוד הבא מאחזר את כל העמודות AlbumId ו-AlbumTitle מהאינדקס AlbumsByAlbumTitle.
מריצים את הדוגמה באמצעות הארגומנט read-data-with-index.
bazel run //google/cloud/spanner/samples:samples -- \
read-data-with-index PROJECT_ID test-instance example-db
הפרטים שמוצגים הם:
AlbumId: 2 AlbumTitle: Forever Hold Your Peace
AlbumId: 2 AlbumTitle: Go, Go, Go
AlbumId: 1 AlbumTitle: Green
AlbumId: 3 AlbumTitle: Terrified
AlbumId: 1 AlbumTitle: Total Junk
הוספת אינדקס לקריאות של אינדקס בלבד
יכול להיות ששמתם לב שבדוגמה הקודמת של קריאה לא נכללת קריאה של העמודה MarketingBudget. הסיבה לכך היא שממשק הקריאה של Spanner לא תומך באפשרות של צירוף אינדקס לטבלת נתונים כדי לחפש ערכים שלא מאוחסנים באינדקס.
יוצרים הגדרה חלופית של AlbumsByAlbumTitle ששומרת עותק של MarketingBudget באינדקס.
בשורת הפקודה
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget)
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) INCLUDE (MarketingBudget)
הוספת אינדקס יכולה להימשך כמה דקות. אחרי שמוסיפים את האינדקס, אמורים לראות:
Schema updating...done.
שימוש בספריית הלקוח של Spanner עבור C++
משתמשים בפונקציה DatabaseAdminClient::UpdateDatabase() כדי להוסיף אינדקס עם פסקה STORING ל-:
מריצים את הדוגמה באמצעות הארגומנט add-storing-index.
bazel run //google/cloud/spanner/samples:samples -- \
add-storing-index PROJECT_ID test-instance example-db
הפלט אמור להיראות כך:
`AlbumsByAlbumTitle2` Index successfully added, new DDL:
database: "projects/PROJECT_ID/instances/test-instance/databases/example-db"
statements: "CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget)"
commit_timestamps {
seconds: 1581012328
nanos: 416682000
}
עכשיו אפשר להריץ קריאה שמביאה את כל העמודות AlbumId, AlbumTitle ו-MarketingBudget מהאינדקס AlbumsByAlbumTitle2:
כדי לקרוא נתונים באמצעות אינדקס האחסון שיצרתם, מריצים שאילתה שמציינת במפורש את האינדקס:
מריצים את הדוגמה באמצעות הארגומנט read-data-with-storing-index.
bazel run //google/cloud/spanner/samples:samples -- \
read-data-with-storing-index PROJECT_ID test-instance example-db
הפלט אמור להיראות כך:
AlbumId: 2 AlbumTitle: Forever Hold Your Peace MarketingBudget: 520000
AlbumId: 2 AlbumTitle: Go, Go, Go MarketingBudget: NULL
AlbumId: 1 AlbumTitle: Green MarketingBudget: NULL
AlbumId: 3 AlbumTitle: Terrified MarketingBudget: NULL
AlbumId: 1 AlbumTitle: Total Junk MarketingBudget: 80000
אחזור נתונים באמצעות טרנזקציות לקריאה בלבד
נניח שרוצים לבצע יותר מקריאה אחת באותה חותמת זמן. עסקאות לקריאה בלבד מתבססות על קידומת עקבית של היסטוריית אישור העסקאות, כך שהאפליקציה תמיד מקבלת נתונים עקביים.
הסוג Transaction משמש לייצוג של כל סוגי העסקאות.
כדי ליצור טרנזקציה לקריאה בלבד, משתמשים בפונקציית היצירה MakeReadOnlyTransaction().
בדוגמה הבאה מוצג איך להריץ שאילתה ולבצע קריאה באותה טרנזקציה לקריאה בלבד:
מריצים את הדוגמה באמצעות הארגומנט read-only-transaction.
bazel run //google/cloud/spanner/samples:samples -- \
read-only-transaction PROJECT_ID test-instance example-db
הפלט אמור להיראות כך:
Read 1 results
SingerId: 2 AlbumId: 2 AlbumTitle: Forever Hold Your Peace
SingerId: 1 AlbumId: 2 AlbumTitle: Go, Go, Go
SingerId: 2 AlbumId: 1 AlbumTitle: Green
SingerId: 2 AlbumId: 3 AlbumTitle: Terrified
SingerId: 1 AlbumId: 1 AlbumTitle: Total Junk
Read 2 results
SingerId: 2 AlbumId: 2 AlbumTitle: Forever Hold Your Peace
SingerId: 1 AlbumId: 2 AlbumTitle: Go, Go, Go
SingerId: 2 AlbumId: 1 AlbumTitle: Green
SingerId: 2 AlbumId: 3 AlbumTitle: Terrified
SingerId: 1 AlbumId: 1 AlbumTitle: Total Junk
הסרת המשאבים
כדי להימנע מחיובים נוספים בחשבון לחיוב ב-Cloud על המשאבים שבהם השתמשתם במדריך הזה, צריך להשליך את מסד הנתונים ולמחוק את המופע שיצרתם.
מחיקת מסד הנתונים
אם מוחקים מופע, כל מסדי הנתונים שבו נמחקים אוטומטית. בשלב הזה נסביר איך למחוק מסד נתונים בלי למחוק את המופע (עדיין תחויבו על המופע).
בשורת הפקודה
gcloud spanner databases delete example-db --instance=test-instance
שימוש במסוף Google Cloud
נכנסים לדף Spanner Instances במסוף Google Cloud .
לוחצים על המופע.
לוחצים על מסד הנתונים שרוצים למחוק.
בדף פרטי מסד הנתונים, לוחצים על מחיקה.
מאשרים שרוצים למחוק את מסד הנתונים ולוחצים על מחיקה.
מחיקת המכונה
מחיקת מופע תגרום להסרה אוטומטית של כל מסדי הנתונים שנוצרו במופע הזה.
בשורת הפקודה
gcloud spanner instances delete test-instance
שימוש במסוף Google Cloud
נכנסים לדף Spanner Instances במסוף Google Cloud .
לוחצים על המופע.
לוחצים על Delete.
מאשרים שרוצים למחוק את המופע ולוחצים על מחיקה.
המאמרים הבאים
במאמר אימות לשירותי Cloud באמצעות ספריות לקוח מוסבר על הרשאות ופרטי אימות.