כשיוצרים שירות Dataproc Metastore, צריך לבחור להשתמש באחד מפרוטוקולי נקודות הקצה הבאים:
- פרוטוקול Apache Thrift
- פרוטוקול gRPC
הפרוטוקול הזה מגדיר איך לקוחות Hive Metastore ניגשים למטא-נתונים שמאוחסנים בשירות Dataproc Metastore. הבחירה הזו יכולה להשפיע גם על התכונות שאפשר לשלב ולהשתמש בהן בשירות.
בדף הזה מוסבר על ההבדלים המושגיים בין כל אחד מהפרוטוקולים של נקודות הקצה.
Apache Thrift
הפרוטוקול Apache Thrift הוא ברירת המחדל הקודמת שנבחרת מראש כשיוצרים שירות Dataproc Metastore.
פרוטוקול Thrift תומך ב-Kerberos רק בשירותים באזור יחיד שהוגדרו עם שירותי VPC. הוא לא תומך ב-Kerberos בשום שירות שהוגדר באמצעות Private Service Connect.
אם אתם צריכים Kerberos, מומלץ להשתמש בפרוטוקול gRPC. פרוטוקול gRPC תומך ב-Kerberos לשירותים באזור יחיד עם כל הגדרות הרשת.
אם אתם משתמשים בנקודת קצה של Thrift, אתם יכולים לבחור את מספר היציאה שאליו מתחבר ממשק Thrift. כברירת מחדל, נעשה שימוש במספר היציאה 9083.
אחרי שבוחרים את פרוטוקול Thrift
אחרי שיוצרים Dataproc Metastore באמצעות Thrift, אפשר להתחבר אליו מאשכול Dataproc או מאשכול בניהול עצמי. לאחר מכן, האשכול משתמש ב-Dataproc Metastore בתור Hive metastore.
gRPC
פרוטוקול gRPC הוא האפשרות המודרנית, הניידת והביצועית שצריך לבחור באופן מפורש כשיוצרים שירות Dataproc Metastore.
אם בוחרים בפרוטוקול gRPC, אי אפשר לעדכן אותו ל-Thrift במועד מאוחר יותר. אם רוצים לעבור מ-gRPC ל-Thrift, צריך ליצור Dataproc Metastore חדש.
אם משתמשים בנקודת קצה של gRPC, אי אפשר לבחור את מספר היציאה שמשמש את ממשק gRPC. במקום זאת, מספר היציאה 443 מוקצה באופן אוטומטי לממשק.
אחרי שבוחרים את פרוטוקול gRPC
אחרי שיוצרים Dataproc Metastore באמצעות פרוטוקול נקודת הקצה gRPC, צריך להעניק תפקידי IAM נוספים. אחרי זה, אפשר להתחבר אליו מאשכול Dataproc. לאחר מכן, האשכול משתמש ב-Dataproc Metastore בתור Hive metastore.