SSD- oder HDD-Speicher wählen
Beim Erstellen einer Bigtable-Instanz bestimmen Sie, ob die zugehörigen Cluster Daten auf einem Solid State Drive (SSD) oder einem Festplattenlaufwerk (HDD) speichern:
- SSD-Speicher: ist die effizienteste und kostengünstigste Wahl für die meisten Anwendungsfälle.
- HDD-Speicher: ist manchmal angemessen für große Datasets, die nicht latenzempfindlich sind und auf die nur selten zugegriffen wird.
Bigtable-Instanzen, die SSD-Speicher verwenden, unterstützen mehrstufigen Speicher (Vorschau). Sie können auf SSD-Clustern eine Speicherklasse für selten genutzte Daten auf Tabellenebene aktivieren, in der Sie selten genutzte Daten am kostengünstigsten speichern können. Weitere Informationen finden Sie unter Übersicht über die verschiedenen Speicherstufen.
Egal, welche Art der Speicherung Sie wählen, Ihre Daten werden auf einem verteilten, replizierten Dateisystem gespeichert, das sich über viele physische Laufwerke erstreckt.
Vergleich der Speicherebenen
In den folgenden Tabellen werden die Bigtable-Speicherstufen je nach Version Ihrer Instanz verglichen.
Enterprise-Version
| Speicher-Tier | Knotenkapazität | Erwartete Latenz | Vorgänge | Optimal für |
|---|---|---|---|---|
| SSD-Instanz | 5 TB SSD | Schreiben/Lesen: einstelliger Millisekundenbereich | Schreiben, lesen, aktualisieren, löschen | Arbeitslasten mit hohem Schreib-/Lesedurchsatz und niedriger Latenz |
| SSD-Instanz, mehrstufiger Speicher aktiviert | 32 TB (bis zu 5 TB SSD) | SSD-Schreib-/Lesevorgänge: einstelliger Millisekundenbereich | Schreiben, lesen, aktualisieren, löschen | Große Datasets mit selten aufgerufenen Daten |
| Seltener Zugriff: niedriger zweistelliger Millisekundenbereich | Schreibgeschützt | |||
| HDD-Instanz | 16 TB | Schreiben: einstellige Millisekunden Lesen: niedrige zweistellige Millisekunden |
Schreiben, lesen, aktualisieren, löschen | Große Datasets mit latenzunempfindlichen Arbeitslasten |
Enterprise Plus-Version
| Speicher-Tier | Knotenkapazität | Erwartete Latenz | Vorgänge | Optimal für |
|---|---|---|---|---|
| SSD-Instanz | 5 TB SSD | Schreiben/Lesen: einstelliger Millisekundenbereich | Schreiben, lesen, aktualisieren, löschen | Arbeitslasten mit hohem Schreib-/Lesedurchsatz und niedriger Latenz |
| SSD-Instanz, mehrstufiger Speicher aktiviert | 64 TB (bis zu 5 TB SSD) | SSD-Schreib-/Lesevorgänge: einstelliger Millisekundenbereich | Schreiben, lesen, aktualisieren, löschen | Große Datasets mit selten aufgerufenen Daten |
| Seltener Zugriff: niedriger zweistelliger Millisekundenbereich | Schreibgeschützt | |||
| HDD-Instanz | 16 TB | Schreiben: einstellige Millisekunden Lesen: niedrige zweistellige Millisekunden |
Schreiben, lesen, aktualisieren, löschen | Große Datasets mit latenzunempfindlichen Arbeitslasten |
Weitere Informationen zur Leistung von Bigtable-Speichertypen finden Sie unter Leistung verstehen. Weitere Informationen zu Versionen finden Sie unter Übersicht über Versionen.
Im Zweifel SSD wählen
Es gibt einige Gründe, warum SSD normalerweise die beste Speicherart für Ihren Bigtable-Cluster darstellt:
- SSD ist deutlich schneller als HDD und die Leistung lässt sich besser vorhersehen. In einem Bigtable-Cluster bietet SSD-Speicher wesentlich geringere Latenzen für Lese- und Schreibvorgänge als HDD-Speicher.
- Der Datendurchsatz bei HDD ist viel stärker begrenzt als der bei SSD. In einem Cluster mit HDD-Speicher ist es möglich, den maximalen Durchsatz zu erreichen, bevor die CPU-Auslastung 100 % erreicht. Das ist eine Situation, die Sie mit dem Messwert Laufwerkslast überwachen können. Für einen höheren Durchsatz müssen Sie mehr Knoten hinzufügen, aber die Kosten für die zusätzlichen Knoten könnten die Ersparnis für die Nutzung der HDD-Speicherung schnell übersteigen. Die SSD-Speicherung ist nicht derartig beschränkt, da sie einen viel höheren Durchsatz pro Knoten bietet. Ein Cluster, der SSD-Speicherung verwendet, erreicht grundsätzlich nur dann das Durchsatzmaximum, wenn er die gesamte verfügbare CPU- und Speicherleistung beansprucht.
- Individuelle Zeilen lesen ist sehr langsam auf HDD. Wegen der Festplattensuchzeit unterstützt HDD nur 5 % der APS bei Lesevorgängen von SSD-Speicherung. Große Scans über mehrere Zeilen sind jedoch nicht so stark betroffen.
- SSD-Speicher unterstützen eine Speicheroption mit verschiedenen Stufen für Daten, auf die selten zugegriffen wird.
- Die In-Memory-Stufe (Vorschau) ist nur für Instanzen verfügbar, die SSD-Speicher verwenden. Für In-Memory-Cache ist die Enterprise Plus-Version erforderlich.
Ein möglicher Nachteil von SSD-Speichern besteht darin, dass abhängig von der Menge der gespeicherten Daten mehr Knoten in Ihren Clustern erforderlich sind. In der Praxis benötigen Sie jedoch möglicherweise diese zusätzlichen Knoten sowieso, damit Ihre Cluster den eingehenden Traffic verarbeiten können, und nicht nur, um die Menge der gespeicherten Daten zu unterstützen.
Anwendungsfälle für HDD-Speicherung
HDD-Speicherung eignet sich für Anwendungsfälle, die alle folgenden Kriterien erfüllen:
- Ihre Arbeitslasten sind schreiblastig und datengesteuert.
- Ihre Arbeitslasten reagieren nicht auf Latenz.
- Ihre Daten unterstützen keine an Nutzer gerichtete Anwendung.
- Ihre Batch-Arbeitslasten bestehen hauptsächlich aus Scans und Schreibvorgängen mit gelegentlichen zufälligen Lesevorgängen für eine kleine Anzahl von Zeilen oder für Lesevorgänge.
- Sie planen nicht, die 2-fache Knotenskalierung zu verwenden.
- In der Enterprise Plus-Version möchten Sie Data Boost für HDD verwenden.
Wenn Sie beispielsweise umfangreiche Verlaufsdaten für eine große Anzahl von Remote-Sensing-Geräten speichern und dann die Daten für das Erstellen von Tagesberichten verwenden möchten, können die Kosteneinsparungen für den Festplattenspeicher den Kompromiss bei der Leistung möglicherweise rechtfertigen. Wenn Sie andererseits planen, die Daten für die Echtzeitanzeige in einem Dashboard zu verwenden, ist es wahrscheinlich nicht sinnvoll, HDD-Speicherung zu verwenden. Lesevorgänge wären in diesem Fall um einiges häufiger und sind mit HDD-Speicherung deutlich langsamer.
Zwischen SSD- und HDD-Speicherung wechseln
Bei der Erstellung einer Bigtable-Instanz ist die Entscheidung zwischen SSD- und HDD-Speicher für die Instanz dauerhaft. Mit derGoogle Cloud -Konsole können Sie nicht den Speichertyp ändern, der für die Instanz verwendet wird.
Wenn Sie den Speichertyp ändern möchten, in dem eine Tabelle gespeichert ist, verwenden Sie die Sicherungsfunktion:
- Erstellen oder planen Sie eine Instanz, die den gewünschten Speichertyp verwendet.
- Erstellen Sie eine Sicherung der Tabelle.
- Stellen Sie die Sicherung aus einer Sicherung in einer neuen Tabelle in der anderen Instanz wieder her.