Managed Service for Apache Spark באשכולות מאפשר לכם ליהנות מכלי נתונים בקוד פתוח לעיבוד ברצף (batch processing), לשליחת שאילתות, להעברת נתונים בסטרימינג וללמידת מכונה. השירות המנוהל של Apache Spark באוטומציה של אשכולות עוזר לכם ליצור אשכולות במהירות, לנהל אותם בקלות ולחסוך כסף על ידי השבתת אשכולות כשאתם לא צריכים אותם. כך תוכלו להשקיע פחות זמן וכסף באדמיניסטרציה ולהתמקד בעבודה ובנתונים שלכם.
היתרונות של Managed Service for Apache Spark באשכולות
בהשוואה למוצרים מסורתיים מקומיים ולשירותי ענן מתחרים, Managed Service for Apache Spark מספק מספר יתרונות ייחודיים לאשכולות של שלושה עד מאות צמתים:
- עלות נמוכה – התמחור של Managed Service for Apache Spark באשכולות הוא סנט אחד בלבד לשעה לכל מעבד וירטואלי באשכול, בנוסף ל Google Cloud משאבים אחרים שבהם אתם משתמשים. בנוסף למחיר הרצפה הזה, Managed Service for Apache Spark יכול לכלול מופעים זמניים של מכונה וירטואלית עם מחירים נמוכים יותר של מחשוב, וכך להפחית עוד יותר את העלויות. במקום לעגל את השימוש שלכם כלפי מעלה לשעה הקרובה, שירות Managed Service for Apache Spark באשכולות מחייב אתכם רק על מה שאתם באמת משתמשים בו, עם חיוב לפי שניות ותקופת חיוב מינימלית קצרה של דקה אחת.
- מהירות גבוהה במיוחד – בלי להשתמש ב-Managed Service for Apache Spark באשכולות, יכול לקחת חמש עד 30 דקות ליצור אשכולות של Spark ו-Hadoop במקום או דרך ספקי IaaS. לשם השוואה, הפעלה, שינוי גודל וכיבוי של אשכולות ב-Managed Service for Apache Spark מתבצעים במהירות, וכל אחת מהפעולות האלה אורכת 90 שניות או פחות, בממוצע. כך תוכלו להקדיש פחות זמן להמתנה לאשכולות ויותר זמן לעבודה עם הנתונים.
- משולב – ל-Managed Service for Apache Spark on clusters יש שילוב מובנה עם שירותים אחרים של Google Cloud , כמו BigQuery, Cloud Storage, Bigtable, Cloud Logging ו-Cloud Monitoring, כך שאתם מקבלים יותר מסתם אשכול Spark או Hadoop – אתם מקבלים פלטפורמת נתונים מלאה. לדוגמה, אתם יכולים להשתמש ב-Managed Service for Apache Spark באשכולות כדי לבצע ETL לטרה-בייט של נתוני יומן גולמיים ישירות ל-BigQuery לצורך דיווח עסקי.
- מנוהל – שימוש באשכולות Spark ו-Hadoop ללא עזרה של אדמין או תוכנה מיוחדת. אפשר ליצור אינטראקציה עם אשכולות ועבודות של Spark או Hadoop באמצעות מסוף Google Cloud , Cloud SDK או Managed Service for Apache Spark on clusters API בארכיטקטורת REST. כשמסיימים להשתמש באשכול, אפשר להשבית אותו כדי שלא תשלמו על אשכול בלי פעילות. לא צריך לדאוג לגבי אובדן נתונים, כי Managed Service for Apache Spark משולב עם Cloud Storage, BigQuery ו-Bigtable.
- פשוט ומוכר – לא צריך ללמוד כלים או ממשקי API חדשים כדי להשתמש ב-Managed Service for Apache Spark באשכולות, כך שאפשר להעביר פרויקטים קיימים ל-Managed Service for Apache Spark באשכולות בלי לפתח אותם מחדש. מערכות כמו Spark, Hadoop, Pig ו-Hive מתעדכנות לעיתים קרובות, כך שתוכלו להיות פרודוקטיביים מהר יותר.
מה כלול ב-Managed Service for Apache Spark באשכולות?
רשימת הגרסאות של קוד פתוח (Hadoop, Spark, Hive ו-Pig) ומחברים שנתמכות על ידי Managed Service for Apache Spark באשכולות זמינה במאמר רשימות גרסאות של תמונות אשכולות של Managed Service for Apache Spark. Google Cloud
תחילת העבודה
כדי להתחיל, אפשר לעיין במדריכים למתחילים בנושא Managed Service for Apache Spark on clusters. אפשר לגשת אל Managed Service for Apache Spark באשכולות בדרכים הבאות:
- באמצעות API בארכיטקטורת REST
- שימוש ב-Cloud SDK
- שימוש במסוףGoogle Cloud
- שימוש בספריות לקוח ב-Cloud