Apache Hive mit Dataproc Metastore verwenden

Auf dieser Seite sehen Sie ein Beispiel für die Verwendung von Apache Hive mit einem Dataproc Metastore Dienst. In diesem Beispiel starten Sie eine Hive-Sitzung in einem Managed Service for Apache Spark-Cluster und führen dann Beispielbefehle aus, um eine Datenbank und eine Tabelle zu erstellen.

Hinweis

Verbindung zu Apache Hive herstellen

Wenn Sie Hive verwenden möchten, stellen Sie über SSH eine Verbindung zum Managed Service for Apache Spark-Cluster her, der mit Ihrem Dataproc Metastore-Dienst verknüpft ist. Sobald die Verbindung hergestellt ist, können Sie Hive-Befehle über das SSH-Terminalfenster in Ihrem Browser ausführen, um Ihre Metadaten zu verwalten.

Verbindung zu Hive herstellen

  1. Rufen Sie in der Google Cloud Console die Seite VM Instanzen auf.
  2. Klicken Sie in der Liste der VM-Instanzen in der Zeile der Managed Service for Apache Spark-VM-Instanz, zu der Sie eine Verbindung herstellen möchten, auf SSH.

Im Stammverzeichnis des Knotens wird ein Browserfenster mit einer Ausgabe ähnlich der folgenden geöffnet:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Führen Sie die folgenden Befehle in der SSH-Sitzung aus, um Hive zu starten und eine Datenbank und eine Tabelle zu erstellen:

  1. Starten Sie Hive.

    hive
    
  2. Erstellen Sie eine Datenbank mit dem Namen myDatabase.

    create database myDatabase;
    
  3. Zeigen Sie die von Ihnen erstellte Datenbank an.

    show databases;
    
  4. Verwenden Sie die von Ihnen erstellte Datenbank.

    use myDatabase;
    
  5. Erstellen Sie eine Tabelle mit dem Namen myTable.

    create table myTable(id int,name string);
    
  6. Listen Sie die Tabellen unter myDatabase auf.

    show tables;
    
  7. Zeigen Sie die Tabellenzeilen in der von Ihnen erstellten Tabelle an.

    desc MyTable;
    

Wenn Sie die folgenden Befehle ausführen, wird eine Ausgabe ähnlich der folgenden generiert:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int                                         
name                    string 

Nächste Schritte