Spark ランタイム バージョン 3.0 のコンポーネント
注:
次の行を無効にします。
* 3.0 ランタイムは、デフォルトの文字エンコードとして UTF-8 を使用します。
3.0ランタイムの新機能と改善点:- コンピューティング リソースの取得可能性を高めるために、リージョン ワークロードとマルチゾーン ワークロードがデフォルトで使用されます。
- 以前のランタイムよりも起動が速い
- ワークロードの完了後に VPC IP を迅速にリリースできる高速リソース クリーンアップ
- エンドユーザー認証情報はデフォルトですべてのワークロードで使用される
- すぐに使用できる BigQuery ネイティブ テーブルの操作用に事前構成された新しい
bigquerySpark カタログ - Spark サーバーレス固有の新しい IAM ロール
- 新しい
dataproc-rm.googleapis.comAPI の有効化が必要
3.0ランタイムでサポートされていない機能と非推奨の機能:- 永続的履歴サーバー(PHS)はサポートされていません。代わりに、Spark UI を使用してください。
- SparkR バッチはサポートされていません。代わりに、
sparklyrを使用してください。 - Jupyter セッションはサポートされていません。代わりに、インタラクティブな Spark 開発の業界標準である Spark Connect セッションを使用します。