Der hierarchische Namespace ist eine Funktion von Cloud Storage, mit der Sie Objekte in Ordnern organisieren und Ihre Daten in einer logischen Dateisystemstruktur speichern können. So lassen sich Datenverwaltungsaufgaben einfacher optimieren. Der hierarchische Namespace bietet die leistungsstarke Verzeichnissemantik und die atomaren Ordneroperationen, die erforderlich sind, um datenintensive KI/ML- und Analysearbeitslasten zu beschleunigen.
Auf dieser Seite erhalten Sie einen Überblick über den hierarchischen Namespace, einschließlich seiner wichtigsten Funktionen, gängigen Anwendungsfälle, Vorteile und Einschränkungen.
Funktionsweise
Wenn Sie Ordner in einem Bucket verwenden möchten, müssen Sie beim Erstellen des Buckets den hierarchischen Namespace aktivieren. Die Einstellung für den hierarchischen Namespace des Buckets kann nach dem Erstellen nicht mehr geändert werden. Informationen zum Aktivieren des hierarchischen Namespaces für Ihren Bucket finden Sie unter Buckets mit aktiviertem hierarchischen Namespace erstellen und verwalten.
Das folgende Diagramm zeigt ein Beispiel für einen Bucket mit aktiviertem hierarchischen Namespace, in dem Objekte in einer hierarchischen Ordnerstruktur organisiert sind. Ein Ordner in einem Bucket mit aktiviertem hierarchischen Namespace kann sowohl Objekte als auch untergeordnete Ordner enthalten.
Wichtige Features
Der hierarchische Namespace bietet folgende Funktionen:
Höhere anfängliche Abfragen pro Sekunde (QPS): Für das Lesen und Schreiben von Objekten bieten Buckets mit aktiviertem hierarchischen Namespace bis zu achtmal höhere anfängliche QPS-Grenzwerte als Buckets ohne aktiviertem hierarchischen Namespace. Die höhere anfängliche Anzahl von Abfragen pro Sekunde erleichtert die Skalierung datenintensiver Arbeitslasten und sorgt für einen höheren Durchsatz. Informationen zu Methoden zur Leistungsoptimierung bei der Verwendung von Ordnern in Buckets mit aktiviertem hierarchischen Namespace finden Sie unter Ordnerverwaltung.
Ordner: Ordner fungieren als Container für Objekte und andere Ordner und unterstützen Vorgänge wie das Erstellen, Löschen und Abrufen von Ordnern. Wenn Sie Ihre Daten in einer Ordnerstruktur speichern, verbessern Sie die Leistung, sorgen für Konsistenz und vereinfachen die Verwaltung von datenintensiven und dateiorientierten Arbeitslasten.
Ordneroperationen: Ordneroperationen bieten Zuverlässigkeit und Verwaltungsfunktionen, einschließlich Erstellen, Löschen, Auflisten und Umbenennen von Ordnern.
Ordner umbenennen: Mit dem Vorgang zum Umbenennen von Ordnern können Sie den Pfad eines Ordners und seiner zugrunde liegenden Ordner atomar umbenennen, ohne Objekte zu löschen. Diese Methode ist effizient und zeitsparend, insbesondere bei großen Ordnern mit mehreren Objekten.
Ordner auflisten: Mit dieser Funktion werden alle Ordner im Bucket oder unter einem bestimmten Ordner aufgelistet. So können Sie die Struktur Ihrer gespeicherten Daten besser verwalten und nachvollziehen.
Wann sollten Sie einen hierarchischen Namespace verwenden?
Sie sollten den hierarchischen Namespace aktivieren, wenn Sie mit Anwendungen arbeiten, die eine Dateisystemhierarchie und ‑semantik erwarten. Der hierarchische Namespace eignet sich für datenintensive Aufgaben wie Analysen und KI/ML-Arbeitslasten. Hier sind einige häufige Szenarien, in denen Sie den hierarchischen Namespace verwenden sollten:
Hadoop-basierte Verarbeitung: Für Hadoop- und Spark-Arbeitslasten wird traditionell eine Dateisystemspeicherstruktur und eine zeitbasierte Benennung von Dateien und Ordnern erwartet. Der hierarchische Namespace lässt sich in den Cloud Storage-Connector einbinden, um den Durchsatz zu erhöhen und atomare Ordnerumbenennungen zu ermöglichen. So werden die Datenintegrität und ‑konsistenz für viele Datenverarbeitungspipelines verbessert.
Verarbeitung dateiorientierter Arbeitslasten: Arbeitslasten wie die Batchanalyse, Finanzdienstleistungen oder Hochleistungs-Computing sind in Partitionen unterteilt, die auf einer Hierarchie von Ordnern und Dateien basieren. Der hierarchische Namespace unterstützt die Verwaltung dieser Umgebungen mit einer speziellen API für die Ordnerverwaltung. Außerdem vereinfacht der hierarchische Namespace die Verwaltung von Ordnern, die andere Ordner und Objekte enthalten. Mit einem einzigen API-Befehl können Sie einen Ordner zusammen mit seinem gesamten Inhalt schnell umbenennen und so wertvolle Zeit und Ressourcen sparen.
KI‑/ML-Verarbeitung: KI‑/ML-Tools wie TensorFlow, Pandas und PyTorch erfordern die Zugriffssteuerung und Semantik des Dateisystems. Der hierarchische Namespace bietet, insbesondere in Kombination mit Cloud Storage FUSE, einen höheren Durchsatz und einen effizienten Datenzugriff. Daher verbessert der hierarchische Namespace die Leistung und Zuverlässigkeit der ML-Modelliteration.
Bevor Sie den hierarchischen Namespace für Ihren Bucket aktivieren, sollten Sie die Einschränkungen des hierarchischen Namespaces berücksichtigen. Informationen zu Einschränkungen des hierarchischen Namespaces finden Sie unter Einschränkungen.
Vorteile des hierarchischen Namespaces
Wenn Sie den hierarchischen Namespace für Ihre Buckets aktivieren, haben Sie folgende Möglichkeiten:
Organisation optimieren: Sie können Ihre Daten in einer hierarchischen Ordnerstruktur organisieren, um Dateien oder Datasets besser zu verwalten und zu finden.
Dateisystem-Ökosystem einrichten: Mit dem hierarchischen Namespace werden Dateisystemfunktionen wie Ordner, Ordnerumbenennung und Ordnerauflistung eingeführt, die für dateiorientierte Anwendungen, einschließlich des Hadoop-Ökosystems und KI/ML-Arbeitslasten, von Vorteil sind.
Leistungssteigerung: Durch die Skalierung datenintensiver Arbeitslasten zur Verarbeitung eines höheren Durchsatzes können Sie die Gesamtleistung Ihrer Anwendung verbessern.
Plattform-Support
Buckets mit hierarchischem Namespace unterstützen die folgenden Cloud Storage-Plattformfunktionen:
Alle Cloud Storage-Objekt-APIs und häufig verwendete Cloud Storage-Funktionen. Details zu nicht unterstützten Funktionen finden Sie unter Einschränkungen.
Datenübertragung von einem Standard-Bucket in einen Bucket mit hierarchischem Namespace mit Storage Transfer Service.
Integration in die folgenden Produkte:
Cloud Storage-Connector, der von Dataproc für Hadoop-Arbeitslasten verwaltet wird. Weitere Informationen finden Sie unter Buckets mit aktiviertem hierarchischen Namespace für Hadoop-Arbeitslasten verwenden.
Cloud Storage FUSE für den dateisystemähnlichen Bucket-Zugriff über Clients.
Kompatibilität mit Cloud Storage-Vorgängen und ‑Funktionen
Buckets mit aktiviertem hierarchischen Namespace haben die folgenden Interaktionen mit anderen Cloud Storage-Vorgängen:
So werden Objektvorgänge verarbeitet
In Buckets mit aktiviertem hierarchischen Namespace werden Objektvorgänge auf folgende Weise verarbeitet:
- Bei Vorgängen wie
Upload,RewriteundComposewerden alle fehlenden übergeordneten Ordner automatisch erstellt, sofern Sie die erforderlichen Berechtigungen haben. Daher müssen Sie Ordner nicht vor dem Hochladen von Objekten erstellen. - Ordner können zwar automatisch bei Objektvorgängen erstellt werden, Sie müssen sie jedoch explizit mit dem Vorgang
DeleteFolderlöschen. - Wenn Sie den Vorgang
ListObjectsmit dem Parameterdelimiterverwenden, wird für jeden untergeordneten Ordner ein Bucket alsprefix.zurückgegeben. Leere Ordner werden jedoch standardmäßig ausgeschlossen. Wenn Sie leere Ordner einbeziehen möchten, ähnlich wie bei einer typischen Dateisystemauflistung, müssen Sie den ParameterincludeFoldersAsPrefixesfestlegen. Informationen zu Methoden zur Leistungsoptimierung beim Auflisten von Objekten in Buckets mit aktiviertem hierarchischen Namespace finden Sie unter Objekte auflisten.
Verwaltung verwalteter Ordner
Buckets mit aktiviertem hierarchischen Namespace bieten eine detaillierte Zugriffssteuerung, wenn sie mit verwalteten Ordnern verwendet werden. In Buckets mit aktiviertem hierarchischen Namespace ist der Ordner das tatsächliche Verzeichnis, in dem Ihre Daten gespeichert sind. Der verwaltete Ordner ist eine spezielle Ressource, mit der detaillierte IAM-Berechtigungen auf dieses Verzeichnis angewendet werden. Wenn Sie den Zugriff auf Ordner verwalten möchten, müssen Sie einen verwalteten Ordner mit demselben Namen wie der Ordner erstellen und dann IAM-Richtlinien darauf anwenden.
Verwaltete Ordner werden in Buckets mit aktiviertem hierarchischen Namespace auf folgende Weise verarbeitet.
- Wenn Sie einen verwalteten Ordner erstellen, werden automatisch alle fehlenden übergeordneten Ordner erstellt, einschließlich des Ordners mit demselben Namen. Angenommen, Sie haben einen leeren Bucket mit aktiviertem hierarchischen Namespace namens
example-ai-datasets. Wenn Sie inexample-ai-datasetseinen verwalteten Ordner mit dem Namen2025/training-data/erstellen, werden der übergeordnete Ordner2025/und der Zielordnertraining-data/automatisch von Cloud Storage erstellt. - Ein verwalteter Ordner kann nicht ohne den zugehörigen Ordner vorhanden sein.
- Wenn Sie einen Ordner löschen, wird der zugehörige verwaltete Ordner automatisch gelöscht.
- Wenn Sie einen Ordner umbenennen, wird der zugehörige verwaltete Ordner automatisch umbenannt.
- Für Buckets mit hierarchischem Namespace gelten die Regeln für die Benennung verwalteter Ordner und die Regeln für die Benennung von Ordnern. Ordnernamen können bis zu 50 Ebenen verschachtelt werden, verwaltete Ordnernamen jedoch nur bis zu 15 Ebenen. Die maximale Größe des Namens eines verwalteten Ordners ist durch die maximale Größe des Ordnernamens begrenzt, die bei UTF-8-Codierung 512 Byte beträgt.
So werden Bucket-Vorgänge verarbeitet
In den folgenden Abschnitten wird beschrieben, wie Bucket-Vorgänge behandelt werden, wenn der hierarchische Namespace aktiviert ist.
Sie können alle Buckets mit aktiviertem hierarchischen Namespace auflisten, unabhängig vom Speicherlayout. Das Speicher-Layout eines Buckets beschreibt, wie Objekte in einem Bucket angeordnet sind, entweder in einem flachen Namespace oder einem hierarchischen Namespace. Eine Anleitung zum Aufrufen des Speicherlayouts eines Buckets finden Sie unter Speicherlayout eines Buckets abrufen. Eine Anleitung zum Auflisten aller Buckets finden Sie unter Buckets auflisten.
Sie können Buckets mit aktiviertem hierarchischen Namespace löschen, sofern sie leer sind. Leere Buckets enthalten keine Objekte oder verwalteten Ordner. Leere Buckets können leere Ordner (ohne Objekte) enthalten.
So werden Regeln zur Verwaltung des Objektlebenszyklus verarbeitet
Mit der Verwaltung des Objektlebenszyklus können Sie Aktionen für Objekte basierend auf Bedingungen wie Alter oder Präfix automatisieren. Regeln für die Verwaltung des Objektlebenszyklus können sich jedoch in Buckets mit hierarchischem Namespace und in Buckets mit flachem Namespace aufgrund des Vorgangs RenameFolder unterschiedlich verhalten:
Regeln für die Verwaltung des Objektlebenszyklus für Buckets mit einem flachen Namespace: Beim Umbenennen wird jedes Objekt mit Tools umbenannt, indem jedes Objekt an einen Zielort kopiert und das ursprüngliche Objekt vom Quellort gelöscht wird. Daher werden am Zielort neue Objekte mit neuen Erstellungszeiten erstellt. Wenn altersbasierte Regeln für die Verwaltung des Objektlebenszyklus für den Zielort angewendet werden, gelten sie nicht sofort für die neuen Objekte, da ihre Erstellungszeiten zurückgesetzt werden.
Regeln zur Verwaltung des Objektlebenszyklus für Buckets mit aktiviertem hierarchischen Namespace: Das Umbenennen eines Ordners erfolgt auf Ordnerebene, ohne dass jedes einzelne Objekt umbenannt werden muss. Die Erstellungszeit der Objekte bleibt erhalten. Das bedeutet, dass die altersbasierten Regeln für die Verwaltung des Objektlebenszyklus sofort auf umbenannte Objekte angewendet werden, wenn sie die Alterskriterien erfüllen.
Preise
Preisinformationen finden Sie unter Cloud Storage – Preise.
Beschränkungen
Hier sind die Einschränkungen für den hierarchischen Namespace:
Sie müssen beim Erstellen des Buckets auswählen, ob der hierarchische Namespace verwendet werden soll. Die Einstellung für den hierarchischen Namespace des Buckets kann nach dem Erstellen nicht mehr geändert werden.
Damit der hierarchische Namespace verwendet werden kann, muss für den Bucket auch der einheitliche Zugriff auf Bucket-Ebene aktiviert sein.
Die folgenden Cloud Storage-Funktionen werden für Buckets mit hierarchischem Namespace nicht unterstützt:
- Bucket-Sperre
- Verschieben von Buckets
- Bucket-übergreifende Replikation
- Objekt-Holds
- Objektaufbewahrungssperre
- Objektversionsverwaltung
Nächste Schritte
- Buckets mit aktiviertem hierarchischen Namespace erstellen
- Ordner erstellen und verwalten
- Ordner umbenennen
- Hierarchischen Namespace für Hadoop-Arbeitslasten verwenden
- Leistung optimieren
Überzeugen Sie sich selbst
Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um sich von der Leistungsfähigkeit von Cloud Storage in der Praxis zu überzeugen. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
Cloud Storage kostenlos testen