主キーの移行の概要

このページでは、Spanner が主キーでどのように機能するかについて説明します。また、次のユースケースに対して主キーの移行戦略を提案します。

UUID キーデータベースの移行
シーケンシャルキーを持つ単一インスタンスデータベースの移行
ライブカットオーバーをサポートするシーケンシャルキーデータベースの移行
アプリケーションロジックに依存するシーケンシャルキーデータベースの移行

主キーの一般的なアプローチとして挙げられるのは、自動インクリメント数などのサロゲートキーを使用する方法です。このような主キーを使用すると、ビジネスロジックが変更された場合でも、現在と将来のキーを柔軟に最適化できます。ボリュームが小さい単一インスタンスのデータベースでは、シーケンシャルキーは良好なパフォーマンスを発揮します。ただし、分散システムでは、シーケンシャルキーにおけるスケーリングは困難です。

Spanner のシーケンシャル主キー

Spanner では、いずれのテーブルでも、そのテーブルの 1 つ以上の列からなる主キーがあります。テーブルの主キーは、テーブルの各行を一意に識別します。Spanner は、主キーを使用してスプリットと呼ばれる行のグループを Spanner インスタンス内のコンピューティングノード全体に分散します。これは範囲シャーディングと呼ばれ、Spanner でクエリを並列化してスケーリングできます。

単調な自動インクリメントキーなど、値が近い主キーを持つ行がある場合、それらの行は同じスプリットに配置される傾向があります。これにより、利用可能なコンピューティングリソースとメモリリソースをすべてスプリットで使用できるホットスポットが作成される可能性があります。ホットスポットが発生すると、レイテンシが増加し、タイムアウトやトランザクションの中断につながる可能性があります。

Spanner のスケーラビリティを活用し、ホットスポットを回避するために、Spanner には主キーの自動インクリメントの代替として組み込みソリューションが用意されています。

主キーに関する推奨事項

Spanner ではデフォルトで主キーに Universally Unique Identifier バージョン 4（UUIDv4）値を使用することをおすすめしています。UUID は、122 ビットのランダムデータを使用する 128 ビットの識別子です。UUIDv4 値は値の範囲が非常に広く、どこで生成されても事実上一意です。そのため、Spanner のホットスポット化を避けるための主キーの候補として適しています。

整数の主キーを使用すると、スペースの消費量が減り、アプリケーションの変更における複雑さが軽減されるため、整数の主キーを使用することをおすすめします。正のビット反転シーケンスを使用すると、64 ビットの正の整数空間に均等に分散される一意の主キー値を生成できます。

ホットスポットを防ぐための主キーの選択については、スキーマ設計のベストプラクティスをご覧ください。

移行戦略

アプリケーションのユースケースとニーズに応じて、主キーの移行戦略を展開できます。これらの各移行戦略を以下に示します。

移行する主キーの忠実性と正確性を確保する。
型や主キー値の変更といった、ダウンストリームアプリケーションの変更を最小限に抑える。
パフォーマンスとスケーラビリティのために Spanner のベストプラクティスを実装する。
Spanner は、新しいデータの生成方法を変更するだけで、既存のデータには影響しない。

UUID キーデータベースの移行

UUID 主キーを使用するデータベースから Spanner に移行する場合について考えてみましょう。既存の UUID キーをソースデータベースで文字列として構成し、そのまま Spanner にインポートします。UUID 値（特に v4）は、生成される場所に関係なく事実上一意です。

Spanner で GENERATE_UUID() 関数（GoogleSQL、PostgreSQL）を使用して、UUID キーデータベースを移行できます。

UUID キーデータベースの移行手順については、UUID キー列を移行するをご覧ください。

シーケンシャルキーを持つ単一インスタンスデータベースの移行

MySQL の AUTO_INCREMENT、PostgreSQL の SERIAL、SQL Server または Oracle の標準 IDENTITY 型など、単調なシーケンシャルキーを使用する単一インスタンスデータベースから移行する場合について考えてみましょう。

既存のキーの範囲内の値をスキップし、新しいビット反転キーを生成するように Spanner SEQUENCE オブジェクトを構成します。Spanner の SEQUENCE オブジェクトによって生成されるビット反転キーは常にゼロより大きく、64 ビットの正の整数空間に均一に分布します。

シーケンシャルキーを持つデータベースの移行手順については、自動生成されたシーケンシャル主キーを移行するをご覧ください。

ライブカットオーバーをサポートするシーケンシャルキーデータベースの移行

単調なシーケンシャルキーを持つ単一インスタンスデータベースから Spanner に移行し、データベースシステム間でライブカットオーバーを行うなどのレプリケーションシナリオに対応するとします。

ソースデータベースにおける既存のキーの値範囲全体をスキップし、Spanner で新しいビット反転キーを生成するように Spanner SEQUENCE オブジェクトを構成します。Spanner SEQUENCE オブジェクトによって生成されるビット反転キーは常に 0 より大きくなりますが、順序付けはされません。

ライブカットオーバーがサポートされているデータベースを移行する手順については、Spanner とソースデータベースを使用するをご覧ください。

アプリケーションロジックに依存するシーケンシャルキーデータベースの移行

単調なシーケンシャルキーを使用するデータベースから移行し、アプリケーションロジックが主キーの順序に基づいて新しく作成されたデータの更新頻度を判断したり、シーケンス化する場合について考えてみましょう。

シャード ID やハッシュなど均等に分散された値を最初のコンポーネントとし、連続する数値を 2 番目のコンポーネントとして組み合わせる複合キーを作成します。これにより、順序付けされたキー値は保持されますが、大規模なホットスポットが発生しません。

アプリケーションロジックに依存するシーケンシャルキーデータベースの移行手順については、独自の主キーを移行するをご覧ください。

次のステップ

移行ワークフローの詳細については、主キーを移行するをご覧ください。

主キーの移行の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Spanner のシーケンシャル主キー

主キーに関する推奨事項

移行戦略

UUID キー データベースの移行

シーケンシャル キーを持つ単一インスタンス データベースの移行

ライブ カットオーバーをサポートするシーケンシャル キー データベースの移行

アプリケーション ロジックに依存するシーケンシャル キー データベースの移行