בדף הזה מוצגת דוגמה לשימוש ב-Apache Hive עם שירות Dataproc Metastore. בדוגמה הזו, מפעילים סשן של Hive באשכול Dataproc, ואז מריצים פקודות לדוגמה כדי ליצור מסד נתונים וטבלה.
לפני שמתחילים
- יוצרים שירות Dataproc Metastore.
- מצרפים את שירות Dataproc Metastore לאשכול Dataproc.
חיבור אל Apache Hive
כדי להתחיל להשתמש ב-Hive, צריך להשתמש ב-SSH כדי להתחבר לאשכול Dataproc שמשויך לשירות Dataproc Metastore. אחרי שמתחברים, אפשר להריץ פקודות Hive מחלון הטרמינל של SSH בדפדפן כדי לנהל את המטא-נתונים.
כדי להתחבר ל-Hive
- נכנסים לדף VM Instances במסוף Google Cloud .
- ברשימת המכונות הווירטואליות, לוחצים על SSH בשורה של מכונת Dataproc שרוצים להתחבר אליה.
חלון דפדפן נפתח בספריית הבית של הצומת עם פלט שדומה לזה:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
כדי להפעיל את Hive וליצור מסד נתונים וטבלה, מריצים את הפקודות הבאות בסשן SSH:
מפעילים את Hive.
hiveיוצרים מסד נתונים בשם
myDatabase.create database myDatabase;מציגים את מסד הנתונים שיצרתם.
show databases;משתמשים במסד הנתונים שיצרתם.
use myDatabase;יוצרים טבלה בשם
myTable.create table myTable(id int,name string);מפרטים את הטבלאות בקטע
myDatabase.show tables;הצגת השורות בטבלה שיצרתם.
desc MyTable;
הרצת הפקודות הבאות יוצרת פלט דומה לזה:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string