Halaman ini menjelaskan Rapid Cache, sebuah fitur yang menyediakan cache baca berbasis zona yang didukung SSD untuk bucket Cloud Storage, sehingga Anda dapat memperoleh throughput yang lebih tinggi dan latensi yang lebih rendah pada data yang disimpan. Rapid Cache menyediakan kapasitas penyimpanan dan bandwidth yang otomatis ditingkatkan atau diturunkan skalanya sesuai kebutuhan Anda.
Karena manfaatnya, Rapid Cache berguna untuk meningkatkan performa dan mengurangi biaya jaringan yang terkait dengan workload baca berat.
Lihat Membuat dan mengelola cache untuk mempelajari cara membuat dan mengelola cache di Rapid Cache.
Bagaimana cara kerjanya?
Dengan Rapid Cache, Anda dapat membuat cache di zona yang sama dengan workload Anda. Saat Anda membuat cache di zona, permintaan baca data yang berasal dari zona tersebut diproses oleh cache, bukan bucket. Setiap cache melayani klien dalam zona yang sama dengan cache. Data hanya akan di-ingest ke dalam cache dari bucket Anda saat data tersebut dibaca oleh VM yang berada di zona yang sama dengan cache. Selain itu, data dapat di-ingest saat data ditulis ke bucket Anda jika Anda mengonfigurasi ingest saat menulis. Metadata tidak di-cache dan permintaan metadata objek diproses oleh bucket, bukan cache.
Rapid Cache adalah layanan terkelola sepenuhnya dan selalu menampilkan data yang konsisten.
Penskalaan otomatis batas bandwidth dan ukuran cache
Rapid Cache menyediakan kapasitas dan bandwidth penyimpanan sementara yang otomatis di-scale naik atau turun sesuai dengan jumlah data yang disimpan dalam cache.
Batas bandwidth cache dimulai dari 100 Gbps dan diskalakan dengan kecepatan 20 Gbps per 1 TiB data yang disimpan. Anda dapat meningkatkan bandwidth awal atau total batas bandwidth dengan meningkatkan jumlah data yang disimpan dalam cache, membuat lebih banyak cache di zona, atau menghubungi Manajer Akun Teknis atau perwakilan Google Anda.
Untuk mempelajari lebih lanjut batas ukuran dan bandwidth untuk Rapid Cache, lihat Kuota & batas Cloud Storage.
Menyimpan data ke dalam cache di zona
Saat membuat cache untuk bucket, cache harus dibuat di
zona dalam lokasi bucket Anda. Misalnya, jika bucket Anda berada di region us-east1, Anda dapat membuat cache di us-east1-b, tetapi tidak di us-central1-c. Jika bucket Anda berada di region ganda ASIA, Anda dapat membuat cache di zona mana pun yang membentuk region asia-east1 dan asia-southeast1.
Untuk setiap bucket, Anda dapat membuat maksimum satu cache per zona. Misalnya,
jika bucket berada di region us-east1, Anda dapat membuat cache di
us-east1-b dan cache lainnya di us-east1-c. Jika bucket berada di multi-region yang mencakup us-central1 dan us-east1, Anda dapat membuat cache di us-central1-a dan cache lain di us-east1-b.
Anda dapat membuat cache di zona selama kapasitas tersedia untuk zona tersebut. Jika kapasitas untuk membuat cache tidak tersedia, Rapid Cache akan terus mencoba membuat cache hingga kapasitas tersedia atau proses pembuatan dibatalkan oleh pengguna. Kapasitas mungkin tetap tidak tersedia untuk jangka waktu yang lama.
Anda dapat menggunakan Rapid Cache di zona berikut. Zona ini dapat digunakan bergantung pada jenis lokasi bucket Anda.
| Area geografis | Lokasi | ||||
|---|---|---|---|---|---|
| Nama zona | Wilayah | Region ganda | Multi-region | Dual-region kustom | |
| Asia | |||||
asia-east1-a |
|||||
asia-east1-b |
|||||
asia-east1-c |
|||||
asia-northeast1-a |
|||||
asia-northeast1-b |
|||||
asia-northeast1-c |
|||||
asia-south1-a |
|||||
asia-south1-b |
|||||
asia-south1-c |
|||||
asia-southeast1-a |
|||||
asia-southeast1-b |
|||||
asia-southeast1-c |
|||||
| Eropa | |||||
europe-north1-a |
|||||
europe-north1-b |
|||||
europe-north1-c |
|||||
europe-west1-b |
|||||
europe-west1-c |
|||||
europe-west1-d |
|||||
europe-west4-a |
|||||
europe-west4-b |
|||||
europe-west4-c |
|||||
europe-west6-a |
|||||
europe-west6-b |
|||||
| Amerika Serikat | |||||
us-central1-a |
|||||
us-central1-b |
|||||
us-central1-c |
|||||
us-central1-f |
|||||
us-central1-ai1a
(Zona AI) |
|||||
us-east1-b |
|||||
us-east1-c |
|||||
us-east1-d |
|||||
us-east4-a |
|||||
us-east4-b |
|||||
us-east4-c |
|||||
us-east5-a |
|||||
us-east5-b |
|||||
us-east5-c |
|||||
us-south1-a |
|||||
us-south1-b |
|||||
us-south1-c |
|||||
us-south1-ai1b
(Zona AI) |
|||||
us-west1-a |
|||||
us-west1-b |
|||||
us-west1-c |
|||||
us-west3-a |
|||||
us-west3-b |
|||||
us-west3-c |
|||||
us-west4-a |
|||||
us-west4-b |
|||||
us-west4-c |
|||||
Penyerapan data
Data selalu diserap ke dalam cache setelah pertama kali diakses dari bucket. Pembacaan pertama disajikan sebagai cache miss dan pembacaan berikutnya disajikan sebagai cache hit, sehingga mempercepat pembacaan data. Secara opsional, Anda dapat mengonfigurasi cache untuk memasukkan data saat penulisan guna menghindari cache miss awal. Hal ini bermanfaat untuk kasus penggunaan seperti memulihkan checkpoint atau menyiapkan pipeline data untuk melatih model.
Saat memproses data ke dalam cache, Rapid Cache memecah objek menjadi chunk yang lebih kecil dan berukuran tetap. Memecah objek menjadi beberapa bagian memungkinkan penyimpanan dalam cache yang lebih terperinci, terutama untuk file besar yang hanya diakses bagian tertentu.
Chunk adalah blok data 2 MB. Saat permintaan dibuat untuk suatu objek, Cache Cepat mengidentifikasi potongan 2 MB mana yang mencakup rentang byte yang diminta dan mengelola potongan tersebut secara terpisah.
Perilaku penyerapan data berbeda-beda bergantung pada ukuran objek yang diserap ke dalam cache:
Untuk permintaan baca ke objek yang lebih besar dari 2 MB, hanya chunk yang berisi rentang byte yang diminta yang akan diproses. Misalnya, membaca 1 MB pertama dari file 100 MB hanya akan menyerap potongan 2 MB pertama.
Untuk permintaan baca ke objek yang lebih kecil dari 2 MB (misalnya, gambar 500 KB), seluruh objek akan dimasukkan ke dalam cache.
Konfigurasi cache
Anda dapat menyetel properti berikut saat mengonfigurasi cache:
Time to live (TTL)
TTL adalah waktu terlama data akan tetap berada di cache sejak terakhir dibaca. Misalnya, jika TTL ditetapkan ke 24 jam, potongan data yang terakhir dibaca pada pukul 11.00 hari Senin tanpa pembacaan berikutnya akan dikeluarkan dari cache pada pukul 11.00 hari Selasa. Anda dapat menyetel TTL antara 24 jam dan 7 hari. Jika tidak ditentukan, TTL ditetapkan ke 24 jam secara default.
Penyerapan saat penulisan
Menyerap data ke dalam cache saat penulisan objek mempercepat workload baca setelah tulis, seperti pembuatan checkpoint dan output penyiapan data untuk tugas pelatihan. Saat Anda mengonfigurasi cache untuk menyerap data saat penulisan, data akan ditulis ke cache saat diupload ke bucket. Pendekatan proaktif ini menghilangkan cache miss awal dan memungkinkan beban kerja Anda mendapatkan manfaat dari cache hit langsung pada pembacaan pertama.
Penyerapan saat penulisan dapat diaktifkan secara opsional saat Anda memperbarui kriteria penyerapan cache yang ada. Tidak dapat dikonfigurasi selama pembuatan cache awal.
Pertimbangan performa
Chunk tidak ditemukan: Jika permintaan mencakup beberapa chunk dan beberapa chunk ada di cache, sedangkan yang lain tidak, Rapid Cache akan mengambil chunk yang tidak ada secara transparan dari bucket sumber.
TTL dan penghapusan: Kebijakan penghapusan Time to Live (TTL) dan Least Recently Used (LRU) juga beroperasi pada chunk. Bagian file besar yang sering digunakan dapat tetap berada di cache, sedangkan bagian yang jarang digunakan akan dikeluarkan.
Harga
Untuk mengetahui harga penggunaan Rapid Cache, lihat Harga Rapid Cache.
Kontrol biaya
Perluas tips berikut untuk mempelajari cara meminimalkan biaya menjalankan cache:
Pemilihan bucket
Anda hanya boleh membuat cache untuk bucket yang berisi data yang ingin Anda cache.
Pilihan zona
Anda hanya boleh membuat cache di zona tempat workload Anda akan mendapatkan manfaat dari caching.
Setelan TTL
Anda harus menentukan TTL minimum yang diperlukan untuk menyimpan data dalam cache. TTL dapat diubah tanpa mengganggu. Defaultnya adalah 1 hari.
Menonaktifkan cache
Anda dapat menonaktifkan cache untuk menghapusnya secara permanen dari layanan dan menghentikan semua biaya cache terkait agar tidak terakumulasi.
Manfaat
Saat meng-cache data dengan Rapid Cache, Anda akan mendapatkan manfaat berikut:
Mendapatkan akses data yang lebih cepat: Rapid Cache menempatkan data Anda di zona yang sama dengan resource komputasi Anda dan didukung sepenuhnya oleh SSD. Hal ini memungkinkan workload Anda mendapatkan throughput hingga 2,5 TB/dtk dan mengurangi latensi untuk pembacaan yang lebih cepat.
Mengurangi biaya transfer data multi-region: Data yang dibaca dari cache dikenai biaya transfer data yang lebih rendah dibandingkan dengan data yang dibaca langsung dari bucket multi-region.
Mengurangi biaya pengambilan: Biaya pengambilan untuk bucket di Nearline Storage, Coldline Storage, dan Archive Storage tidak berlaku untuk pembacaan data dari cache.
Memperoleh biaya yang lebih rendah dari operasi baca: Operasi baca yang disalurkan dari Rapid Cache dihargai lebih rendah daripada operasi Kelas B yang disalurkan dari bucket di Standard Storage.
Menskalakan otomatis ukuran cache Anda: Cache SSD dinamis Rapid Cache diskalakan secara otomatis berdasarkan penggunaan tanpa Anda perlu menentukan ukuran cache.
Gunakan cache secara efisien: Rapid Cache dapat diaktifkan di bucket yang ada tanpa memerlukan perubahan pada aplikasi atau API yang ada. Data yang disimpan dalam Rapid Cache sangat konsisten.
Untuk mengetahui detail tentang harga, lihat Harga Rapid Cache. Untuk mengetahui informasi tentang kuota, lihat Kuota Rapid Cache.
Kapan sebaiknya Anda menggunakan Cache Cepat?
Gunakan Rapid Cache untuk data yang jarang diubah dan sering dibaca untuk mempercepat pembacaan data untuk beban kerja analisis dan pelatihan serta pemuatan model AI/ML.
Misalnya, Anda melatih model AI di banyak node Google Kubernetes Engine, yang semuanya berulang kali membaca data yang disimpan di bucket Cloud Storage Anda dan berjalan di zona yang sama. Saat Anda membuat cache di zona tempat workload berjalan, cache akan memberikan bandwidth tambahan dan membantu Anda mengurangi biaya transfer data yang terkait dengan membaca data di bucket multi-region, sehingga Anda dapat menjalankan workload yang lebih besar dan diskalakan secara lebih efisien.
Menggunakan Cache Cepat untuk mempercepat pembacaan BigQuery
Cache Cepat dapat digunakan untuk menyalurkan data untuk permintaan baca objek yang dikeluarkan oleh BigQuery. Dengan Rapid Cache, Anda dapat mempercepat pembacaan data untuk aplikasi sekaligus mengoptimalkan efisiensi biaya.
Meskipun BigQuery adalah layanan regional, sumber daya komputasi yang mendasarinya terkadang dapat berpindah antar-zona untuk load balancing. Sebagai praktik terbaik, aktifkan Cache Cepat untuk workload BigQuery di semua zona suatu region untuk memastikan ada cache yang tersedia untuk digunakan jika resource komputasi yang mendasarinya berubah zona. Jika cache di zona tidak digunakan, cache tersebut tidak menimbulkan biaya tambahan karena Rapid Cache adalah layanan pay-per-use. Perhatikan bahwa jika resource workload berpindah zona, cache di zona baru harus mengambil ulang data, yang berpotensi menimbulkan peningkatan biaya penyerapan data satu kali.
Pemberi rekomendasi Cache Cepat
Pemberi rekomendasi Rapid Cache memberikan rekomendasi dan insight untuk membuat cache dalam pasangan zona bucket dengan menganalisis penggunaan dan penyimpanan data Anda. Untuk informasi ringkasan dan petunjuk tentang cara menggunakan pemberi rekomendasi Rapid Cache, lihat Pemberi rekomendasi Rapid Cache.
Operasi cache
Bagian ini menjelaskan operasi yang dapat Anda lakukan pada cache Rapid Cache. Beberapa operasi bersifat asinkron dan menampilkan operasi yang berjalan lama, sementara operasi lainnya bersifat sinkron, dengan operasi dilakukan segera dan menampilkan resource AnywhereCache.
Membuat cache
Saat Anda membuat cache, cache akan memasuki status MEMBUAT saat sedang dibuat, dan memasuki status BERJALAN saat mulai berjalan secara aktif. Operasi pembuatan cache dapat memerlukan waktu hingga 48 jam, setelah itu, operasi akan berakhir.
AnywhereCaches Create API bersifat asinkron. Operasi pembuatan menyebabkan operasi yang berjalan lama ditampilkan. Operasi yang berjalan lama memberikan status operasi pembuatan dan memungkinkan Anda membatalkan operasi sebelum selesai.
Memperbarui cache
Anda dapat memperbarui TTL atau perilaku penyerapan cache dalam status BERJALAN. Saat cache sedang dalam proses diperbarui, kolom pending_update
dievaluasi ke true. Meskipun kolom pending_update bernilai true,
cache tidak dapat diperbarui lagi.
Cache dalam status CREATING atau DISABLED tidak dapat diperbarui. AnywhereCaches Update API bersifat asinkron dan menampilkan operasi yang berjalan lama.
Setelah TTL cache selesai diperbarui, TTL baru akan langsung diterapkan ke data yang ada dan data baru dalam cache.
Mendapatkan cache
Saat Anda mendapatkan cache, Rapid Cache akan menampilkan status dan konfigurasi instance cache. AnywhereCaches Get API bersifat sinkron dan menampilkan resource AnywhereCache.
Mencantumkan cache
Anda dapat menampilkan daftar cache terkait untuk bucket tertentu. AnywhereCaches List API bersifat sinkron dan mendukung penomoran halaman.
Menonaktifkan cache
Anda dapat menonaktifkan cache untuk menghapus cache secara permanen dari konfigurasi bucket Anda. Saat Anda menonaktifkan cache, cache akan memasuki status DISABLED. Selama status ini, Anda tetap dapat membaca data yang ada dari cache, tetapi Anda tidak dapat memasukkan data baru ke dalam cache.
Setelah menonaktifkan cache, ada masa tenggang 1 jam yang dapat Anda manfaatkan untuk membatalkan penonaktifan dengan melanjutkan cache. Setelah masa tenggang 1 jam ini, cache akan dihapus. Saat cache dihapus, semua data dalam cache akan dikeluarkan, dan cache akan dihapus dari bucket.
Selama periode 1 jam sebelum cache dihapus, Anda dapat mengembalikan status DISABLED dengan melanjutkan cache, yang akan membuat cache dilanjutkan dalam status RUNNING.
AnywhereCaches Disable API bersifat sinkron dan menampilkan resource AnywhereCache.
Melanjutkan cache
Anda dapat melanjutkan cache yang berada dalam status DISABLED, selama cache yang dinonaktifkan berada dalam masa tenggang 1 jam. Setelah masa tenggang 1 jam, operasi melanjutkan dilakukan dengan upaya terbaik, karena cache dapat dihapus kapan saja setelah masa tenggang. Setelah dilanjutkan, cache akan memasuki status RUNNING.
AnywhereCaches Resume API bersifat sinkron dan menampilkan resource AnywhereCache.
Pembatasan dan batasan
Untuk menghapus bucket, Anda harus menghapus semua cache terkaitnya terlebih dahulu. Satu-satunya pengecualian adalah saat menghapus bucket menggunakan konsol Google Cloud , yang menghapus semua cache terkait bersama dengan bucket.
Saat melakukan operasi pembuatan, penonaktifan, pelanjutan, atau update cache, batasi kecepatan operasi tidak lebih dari satu operasi per detik. Melakukan lebih dari satu operasi per detik dapat menyebabkan kegagalan.
Cache Cepat bukanlah penyimpanan yang tahan lama dan data dapat dikeluarkan dari cache dalam berbagai skenario. Salah satu skenarionya adalah saat cache diubah ukurannya secara otomatis untuk memastikan bahwa resource yang memadai tersedia untuk workload Anda. Dalam skenario ini, beberapa data mungkin dikeluarkan sesuai dengan algoritma least-recently-used (LRU) hingga layanan Rapid Cache selesai meningkatkan ukuran cache.
Bagaimanapun, data Anda tetap disimpan dengan aman di bucket sumber Anda. Jika data dihapus dari cache karena alasan selain masa berlaku TTL, layanan Rapid Cache akan mencoba memasukkan kembali data ke dalam cache secara transparan dan tanpa biaya bagi Anda. Jika data tidak dapat di-ingest ulang secara transparan atau dihapus karena masa berlaku TTL berakhir, layanan Rapid Cache akan meng-ingest ulang data saat pertama kali dibaca.
Rekomendasi dan insight yang dihasilkan oleh pemberi rekomendasi Rapid Cache tidak dapat dibaca menggunakan BigQuery.
Memecahkan masalah kekurangan resource sementara
Bagian berikut menjelaskan cara memecahkan masalah saat terjadi kekurangan resource sementara, yaitu saat kapasitas SSD atau kapasitas penayangan di zona tertentu tidak mencukupi untuk membuat cache, meningkatkan ukuran cache, atau meningkatkan batas bandwidth cache.
Gagal membuat cache baru
Cache Cepat dapat gagal membuat cache baru di zona tertentu karena kurangnya kapasitas SSD atau resource penayangan throughput, yang mengakibatkan kekurangan resource sementara. Selama jangka waktu ini, Rapid Cache mencoba membuat cache baru hingga 48 jam. Jika resource tersedia dalam jangka waktu 48 jam, Cache Cepat akan menyelesaikan permintaan pembuatan cache dengan berhasil. Jika resource tidak tersedia dalam jangka waktu 48 jam, permintaan pembuatan cache akan gagal.
Cara memecahkan masalah: Untuk menghindari gangguan pada penyimpanan dalam cache, Anda dapat membatalkan operasi pembuatan cache secara manual dan membuat cache baru di zona lain yang mungkin memiliki kapasitas yang tersedia. Untuk memantau atau membatalkan operasi pembuatan cache, lihat menggunakan operasi yang berjalan lama.
Gagal meningkatkan ukuran cache
Cache Cepat dapat gagal meningkatkan ukuran cache jika jumlah kapasitas SSD yang diperlukan tidak tersedia di zona cache.
Meskipun Rapid Cache menawarkan peningkatan ukuran cache otomatis sesuai permintaan, peningkatan ukuran cache bergantung pada ketersediaan kapasitas SSD. Jika kapasitas SSD tidak tersedia saat permintaan peningkatan ukuran cache otomatis dilakukan, Rapid Cache akan terus mengirimkan permintaan hingga kekurangan resource sementara berakhir atau peningkatan ukuran cache tidak lagi diperlukan.
Selama kekurangan resource sementara, data baru akan di-ingest dan data yang ada di cache akan dikeluarkan berdasarkan penggunaan yang paling jarang. Cache yang cukup besar untuk menyimpan sebagian besar data aktif akan mengalami sedikit atau tidak ada dampak pada metrik cache. Cache dengan kapasitas yang lebih kecil daripada jumlah data aktif dapat mengeluarkan data dan menyerap ulang data yang sama lebih sering daripada cache yang tidak terpengaruh oleh kekurangan resource. Jika ukuran sebenarnya cache Anda jauh lebih kecil daripada kapasitas yang diperlukan, Anda mungkin mengalami perilaku terkait kekurangan resource berikut:
- Batas bandwidth cache yang lebih rendah, throughput cache yang lebih rendah, penggunaan kuota bandwidth transfer data yang lebih tinggi, dan kemungkinan dampak pada metrik lainnya
- Penagihan mungkin terpengaruh dengan cara berikut:
- Peningkatan biaya dari biaya penyerapan cache
- Penurunan biaya dari biaya penyimpanan cache
- Penurunan biaya dari biaya transfer keluar data cache
- Mengurangi biaya dari biaya operasi transfer data keluar cache
- Peningkatan biaya dari biaya transfer data multi-region
- Peningkatan biaya dari penggunaan operasi Kelas B
Untuk mengetahui informasi tentang biaya ini, lihat Harga Rapid Cache.
Cara memecahkan masalah: Untuk hasil terbaik selama kekurangan sumber daya sementara, sebaiknya pantau cache Anda dan nonaktifkan cache atau workload yang tidak diperlukan berdasarkan kebutuhan Anda.
Gagal meningkatkan batas bandwidth cache
Kekurangan batas bandwidth cache dapat terjadi untuk sementara selama peningkatan ukuran cache ketika resource penayangan throughput di zona tertentu tidak cukup untuk menskalakan batas bandwidth cache dari cache yang ada pada 20 Gbps per TiB. Selama kekurangan bandwidth cache yang tersedia, Rapid Cache tidak mengizinkan batas bandwidth cache diskalakan pada 20 Gbps per TiB data, tetapi cache terus melayani permintaan baca. Anda dapat meminta bandwidth cache tambahan dengan menghubungi Technical Account Manager atau perwakilan Google Anda. Selama kekurangan bandwidth cache yang tersedia, Anda mungkin melihat peningkatan konsumsi bandwidth traffic keluar data bucket.
Cara memecahkan masalah: Untuk hasil terbaik selama kekurangan resource sementara, sebaiknya pantau cache dan nonaktifkan cache atau workload yang tidak diperlukan berdasarkan kebutuhan Anda.