Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、Presto などの追加コンポーネントをインストールできます。このページでは、必要に応じて、Dataproc クラスタに Presto コンポーネントをインストールする方法について説明します。
Presto(Trino)は、オープンソースの分散 SQL クエリエンジンです。Presto サーバーとウェブ UI は、デフォルトでは、クラスタの最初のマスターノードのポート 8060(Kerberos が有効になっている場合はポート 7778)で使用できます。
デフォルトで、Dataproc 上の Presto は、Hive、BigQuery、Memory、TPCH、TPCDS のコネクタとそれぞれ連携するように構成されています。
Presto コンポーネントを使用してクラスタを作成した後は、次の方法でクエリを実行できます。
gcloud dataproc jobs submit prestoコマンドを使用してローカルのターミナルから実行するprestoCLI(コマンドライン インターフェース)を使用して、クラスタの最初のマスターノードのターミナルウィンドウから実行する(Dataproc で Trino を使用するをご覧ください)
コンポーネントをインストールする
Dataproc クラスタの作成時にコンポーネントをインストールします。コンポーネントは、Dataproc バージョン 1.3 以降で作成されたクラスタに追加できます。
Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。
gcloud コマンド
Presto コンポーネントを含む Dataproc クラスタを作成するには、--optional-componentsフラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。
gcloud dataproc clusters create cluster-name \ --optional-components=PRESTO \ --region=region \ --enable-component-gateway \ ... other flags
プロパティの構成
gcloud dataproc clusters create コマンドに --properties フラグを追加して、presto、presto-jvm、presto-catalog config のプロパティを設定します。
- アプリケーション プロパティ:
presto:接頭辞が付いたクラスタ プロパティを使用して、Presto アプリケーション プロパティを構成します(例:--properties="presto:join-distribution-type=AUTOMATIC")。 - JVM 構成プロパティ:
presto-jvm:接頭辞が付いたクラスタ プロパティを使用して、Presto コーディネーターとワーカー Java プロセスの JVM プロパティを構成します(例:--properties="presto-jvm:XX:+HeapDumpOnOutOfMemoryError")。 - 新しいカタログの作成とカタログ プロパティの追加:
presto-catalog:catalog-name.property-nameを使用して Presto カタログを構成します。例: 次の properties フラグを gcloud dataproc clusters create コマンドで使用すると、prodhive Hive カタログを含む Presto クラスタを作成できます。
/usr/lib/presto/etc/catalog/の下にprodhive.propertiesファイルが作成され、prodhive カタログが有効になります。--properties="presto-catalog:prodhive.connector.name=hive-hadoop2,presto-catalog:prodhive.hive.metastore.uri=thrift://localhost:9083
REST API
Dataproc API を使用して Presto コンポーネントを指定するには、clusters.create リクエストの一部として SoftwareConfig.Component を使用します。
コンソール
- コンポーネントとコンポーネント ゲートウェイを有効にします。
- Google Cloud コンソールで、Dataproc の [クラスタの作成] ページを開きます。[クラスタの設定] パネルが選択されています。
- [コンポーネント] セクションで次の設定を行います。
- [オプション コンポーネント] で、クラスタにインストールする Presto や、他のオプション コンポーネントを選択します。
- [コンポーネント ゲートウェイ] で [コンポーネント ゲートウェイを有効にする] を選択します(コンポーネント ゲートウェイの URL を表示してアクセスするをご覧ください)。