Berikutan pencapaian mengagumkan Upsun yang memotong kos lebar jalur AWS sebanyak 95% menggunakan dm-cache untuk caching SSD tempatan, komuniti teknologi telah mencetuskan perbincangan aktif mengenai penyelesaian caching alternatif dan pertukaran faedah mereka. Kisah kejayaan syarikat ini telah mendorong pembangun dan jurutera infrastruktur untuk berkongsi pengalaman mereka dengan teknologi caching yang berbeza dan menimbulkan soalan penting tentang konsistensi data dan pengoptimuman prestasi.
Keputusan Prestasi dm-cache Upsun:
- Pengurangan 95% dalam trafik bacaan melalui rangkaian
- Peningkatan 30 kali ganda dalam IOPS untuk operasi cache
- Pengurangan 50% dalam latensi bacaan
- Peningkatan 30 kali ganda dalam lebar jalur bacaan untuk data yang kerap diakses
- Saiz cache: 512MB melayani volum RBD sebanyak 5-50GB
Penyelesaian Caching Alternatif Mendapat Perhatian
Perbincangan komuniti telah menyerlahkan beberapa alternatif kepada dm-cache yang telah digunakan oleh pembangun dalam senario yang serupa. Pendekatan Discord menggunakan apa yang diingati oleh sesetengah pihak sebagai SuperDisks telah muncul semula dalam perbualan, di mana mereka melaksanakan strategi pencerminan dengan peranti blok jauh yang dicerminkan secara malas kepada SSD tempatan. Kaedah ini mengutamakan bacaan dari peranti tempatan sambil memastikan penulisan pergi ke kedua-dua lokasi, menawarkan pendekatan berbeza kepada masalah caching.
Open-CAS telah muncul sebagai pilihan lain yang menarik, dengan ahli komuniti mencadangkan ia mungkin menawarkan prestasi yang lebih baik daripada dm-cache. Dikekalkan oleh Intel dan Huawei, penyelesaian caching ini telah mendapat perhatian untuk faedah prestasi yang berpotensi, walaupun sesetengah pembangun menyatakan kebimbangan tentang peralihan dalam penyelenggaraan dari Intel kepada Huawei berikutan pengurangan pasukan pembangunan perisian storan Intel.
Nota: Open-CAS (Open Cache Acceleration Software) adalah penyelesaian caching storan blok sumber terbuka yang direka untuk meningkatkan prestasi dengan menggunakan peranti storan pantas sebagai cache untuk storan yang lebih perlahan.
Perbandingan Penyelesaian Caching:
- dm-cache: Penyelesaian device mapper Linux, hasil terbukti tetapi komuniti mempertikaikan alternatif lain
- bcache: Secara sejarahnya dianggap reka bentuk yang lebih baik daripada dm-cache
- Open-CAS: Diselenggara oleh Intel / Huawei , berpotensi lebih berprestasi
- Pendekatan Discord: Pencerminan peranti blok jauh dengan keutamaan SSD tempatan
Kebimbangan Konsistensi Data Mencetuskan Perdebatan Teknikal
Sebahagian besar perbincangan komuniti tertumpu pada cabaran konsistensi data apabila melaksanakan lapisan caching di hadapan sistem fail teragih. Pembangun telah menimbulkan kebimbangan tentang isu koheren, terutamanya dalam persekitaran berbilang nod di mana berbilang sistem mungkin melakukan penulisan secara serentak.
Perdebatan write-back berbanding write-through telah terbukti sangat kontroversi. Walaupun Upsun memilih mod write-through untuk integriti data dalam persekitaran e-dagang mereka, ahli komuniti telah menunjukkan bahawa pendekatan ini pun mungkin tidak menjamin konsistensi untuk aplikasi yang melakukan operasi baca-kemudian-tulis. Kerumitan meningkat apabila mempertimbangkan isu susunan yang berpotensi dan keperluan untuk bacaan dan penulisan yang konsisten dalam sistem transaksi.
Mod writeback dm-cache adalah menakjubkan dan mengerikan. Ia menyusun semula penulisan, jadi bukan sahaja anda kehilangan data jika cache gagal, anda mungkin telah merosakkan keseluruhan cakera sandaran.
Nota: Mod write-back menyimpan sementara penulisan dalam cache sebelum komit kepada storan utama, manakala mod write-through serta-merta menulis kepada kedua-dua cache dan storan utama.
Pertimbangan Teknikal Utama:
- Mod write-through: Lebih selamat untuk integriti data, penulisan memintas cache
- Mod write-back: Prestasi lebih baik tetapi risiko kehilangan data lebih tinggi
- Isu koheren: Cabaran dalam persekitaran sistem fail teragih berbilang nod
- Saiz cache: Saiz optimum bergantung pada corak set kerja aplikasi
Pertukaran Kos dan Prestasi Di Bawah Penelitian
Komuniti juga telah mempersoalkan ekonomi asas di sebalik caj lebar jalur antara zon ketersediaan. Sesetengah pembangun berhujah bahawa dalam era rangkaian 100-gigabit, caj ini mewakili penetapan harga buatan dan bukannya kos infrastruktur sebenar. Perbandingan dengan penyedia awan lain seperti Azure, yang tidak mengenakan bayaran untuk trafik intra-wilayah, telah menyemarakkan perbincangan tentang sama ada model penetapan harga AWS dibenarkan oleh had teknikal atau sekadar kedudukan pasaran.
Untuk organisasi yang berurusan dengan set data besar dan corak akses rawak, keberkesanan saiz cache kecil kekal sebagai topik perdebatan. Walaupun Upsun mencapai keputusan yang luar biasa dengan volum cache 512MB, pembangun yang bekerja dengan corak beban kerja yang berbeza mempersoalkan sama ada kadar cache hit yang serupa akan dapat dicapai dalam persekitaran mereka.
Memandang ke Hadapan
Perbincangan ini mendedahkan minat yang semakin meningkat dalam penyelesaian storan hibrid yang mengimbangi prestasi, kos, dan kebolehpercayaan. Memandangkan kos infrastruktur awan terus meningkat, lebih banyak organisasi meneroka pendekatan kreatif untuk mengoptimumkan seni bina storan mereka. Pengalaman pelbagai komuniti dengan teknologi caching yang berbeza memberikan wawasan berharga untuk pasukan yang mempertimbangkan pelaksanaan yang serupa, walaupun konsensus kekal bahawa pertimbangan teliti terhadap keperluan konsistensi data adalah penting untuk sebarang strategi caching.
Rujukan: How we cut AWS bandwidth costs 95% with dm-cache: fast local SSD caching for network storage