Cloud Storage には、AI、ML、データ集約型分析など、高いパフォーマンスを必要とするユースケースに合わせてデータ ストレージを最適化するためのさまざまなオプションが用意されています。このページでは、これらのオプションについて説明し、ワークロードのニーズに適したオプションを選択する手順について説明します。
Cloud Storage Rapid プロダクト ファミリー
Cloud Storage Rapid は、AI/ML ワークロードとデータ分析ワークロードのデータ ボトルネックを解消するように設計された、Cloud Storage の高パフォーマンス プロダクト ファミリーです。AI/ML モデルの複雑さが増し、データセットがペタバイト規模に達すると、ストレージ パフォーマンスが、高価な GPU クラスタと TPU クラスタの主なボトルネックになることがよくあります。Cloud Storage Rapid は、ゾーン アーキテクチャを活用して、データをコンピューティング リソースに近づけます。これにより、アクセラレータの飽和状態を維持し、トレーニング時間を短縮し、最も要求の厳しいワークロードの総所有コスト(TCO)を削減できます。Cloud Storage Rapid には、Rapid Bucket と Anywhere Cache が含まれています。
Rapid バケットを使用して Rapid ストレージ クラスにデータを保存する
Rapid Bucket は、ゾーンをバケットのロケーションとして定義することで、Rapid ストレージ クラスにデータを保存できる、高パフォーマンスのゾーン オブジェクト ストレージ ソリューションです。Rapid Bucket を使用すると、AI アクセラレータと同じ物理ゾーンにデータを配置し、他の Cloud Storage プロダクト サービスの中で最も低いレイテンシと最も高いスループットを実現できます。Rapid Bucket は、1 ミリ秒未満のレイテンシ、最大 15 TB/秒の集約スループットを実現し、最大 2,000 万の秒間クエリ数(QPS)をサポートします。
Rapid バケットはステートフルなストリーミング オブジェクトの追加をサポートしているため、アプリケーションは既存のオブジェクトにリアルタイムでデータを書き込むことができます。この機能により、高コストのオブジェクトの書き換えを回避し、データの即時可視化を実現できます。これにより、コンシューマー アプリケーションはデータの書き込み中にデータを読み取ることができます。
最適な用途: 超低レイテンシと高い決定論的パフォーマンスを必要とする AI モデルのトレーニング、チェックポインティング、サービング
このオプションを使用する場合: 読み取りと書き込みの両方に専用のハイパフォーマンスが必要な場合
Rapid Bucket を使用してゾーンバケットを作成する方法については、ゾーンバケットを作成するをご覧ください。
Anywhere Cache を使用してゾーン キャッシュを作成する
Anywhere Cache は、フルマネージド型の SSD ベースのゾーン読み取りキャッシュです。API の変更を必要とせずに、既存のリージョン、デュアルリージョン、マルチリージョンのバケットで動作します。キャッシュは、ワークロードのニーズに応じて自動的にスケールアップまたはスケールダウンする一時的なストレージ容量と帯域幅を提供します。データは、キャッシュと同じゾーンにある VM によって読み取られた場合に、バケットからキャッシュに自動的に取り込まれます。
Anywhere Cache は、2.5 TB/秒の集約スループットを提供し、VM と同じゾーンにデータを配置することで、読み取りのレイテンシを短縮します。キャッシュから配信されるデータは、配信速度が速いだけでなく、バケットから直接配信されるデータよりもデータ転送料金、データ取得料金、オペレーション料金が低くなる可能性があります。詳細については、Anywhere Cache のメリットをご覧ください。
最適な用途: 既存の Cloud Storage バケットから高い読み取り帯域幅を必要とする AI モデルのトレーニング、チェックポイントの復元、サービング
このオプションを使用する場合: 高速化する既存のデータ ストレージが Cloud Storage バケットにある
Anywhere Cache の使用方法については、キャッシュを作成して管理するをご覧ください。