Apache Kafka 向けの Dataflow マネージド I/O

マネージド I/O は、Apache Kafka への読み取りと書き込みをサポートしています。

要件

次の SDK は、Apache Kafka のマネージド I/O をサポートしています。

  • Apache Beam SDK for Java バージョン 2.58.0 以降
  • Apache Beam SDK for Python バージョン 2.61.0 以降

構成

BigQuery 向けマネージド I/O は、次の構成パラメータをサポートしています。

KAFKA 読み取り

構成 種類 説明
bootstrap_servers str Kafka クラスタへの初期接続の確立に使用するホスト / ポートペアのリスト。クライアントは、ここでブートストラップ用に指定されたサーバーに関係なく、すべてのサーバーを使用します。このリストは、完全なサーバーセットを検出するために使用される初期ホストにのみ影響します。このリストは「host1:port1,host2:port2,...」の形式にする必要があります。
topic str なし
allow_duplicates boolean Kafka 読み取りで重複を許可するかどうか。
confluent_schema_registry_subject str なし
confluent_schema_registry_url str なし
consumer_config_updates map[str, str] Kafka コンシューマーの構成パラメータとして機能する Key-Value ペアのリスト。これらの構成の大半は必要ありませんが、Kafka コンシューマーをカスタマイズする必要がある場合は、これを使用できます。詳細なリストについては、https://docs.confluent.io/platform/current/installation/configuration/consumer-configs.html をご覧ください。
file_descriptor_path str プロトコル バッファのファイル記述子セットファイルのパス。このファイルは、スキーマ定義とメッセージのシリアル化に使用されます。
format str Kafka に保存されているデータのエンコード形式。有効なオプションは、RAW、STRING、AVRO、JSON、PROTO です。
message_name str スキーマ抽出とデータ変換に使用するプロトコル バッファ メッセージの名前。
offset_deduplication boolean 再分配でオフセット重複除去モードを使用するかどうか。
redistribute_by_record_key boolean Kafka レコードキーを再分配キーにするかどうか。
redistribute_num_keys int32 Kafka 入力を再分配するためのキーの数。
redistributed boolean Kafka 読み取りを再分配するかどうか。
schema str Kafka トピックでデータがエンコードされるスキーマ。AVRO データの場合、これは AVRO スキーマ構文(https://avro.apache.org/docs/1.10.2/spec.html#schemas)で定義されたスキーマです。JSON データの場合、これは JSON スキーマ構文(https://json-schema.org/)で定義されたスキーマです。Confluent Schema Registry の URL を指定した場合、このフィールドは無視され、スキーマは Confluent Schema Registry から取得されます。

KAFKA 書き込み

構成 種類 説明
bootstrap_servers str Kafka クラスタへの初期接続の確立に使用するホスト / ポートペアのリスト。クライアントは、ここでブートストラップ用に指定されたサーバーに関係なく、すべてのサーバーを使用します。このリストは、完全なサーバーセットを検出するために使用される初期ホストにのみ影響します。| 形式: host1:port1,host2:port2,...
format str Kafka に保存されているデータのエンコード形式。有効なオプションは、RAW、JSON、AVRO、PROTO です。
topic str なし
file_descriptor_path str プロトコル バッファのファイル記述子セットファイルのパス。このファイルは、スキーマ定義とメッセージのシリアル化に使用されます。
message_name str スキーマ抽出とデータ変換に使用するプロトコル バッファ メッセージの名前。
producer_config_updates map[str, str] Kafka プロデューサーの構成パラメータとして機能する Key-Value ペアのリスト。これらの構成の大半は必要ありませんが、Kafka プロデューサーをカスタマイズする必要がある場合は、これを使用できます。詳細なリストについては、https://docs.confluent.io/platform/current/installation/configuration/producer-configs.html をご覧ください。
schema str なし

次のステップ

コード例などの詳細については、次のトピックをご覧ください。