OpenTelemetry Go SDK Menunjukkan 30% Overhed CPU dalam Ujian Prestasi, Mencetuskan Perdebatan Pengoptimuman Komuniti

Pasukan Editorial BigGo

OpenTelemetry Go SDK Menunjukkan 30% Overhed CPU dalam Ujian Prestasi, Mencetuskan Perdebatan Pengoptimuman Komuniti

Penanda aras prestasi terkini bagi OpenTelemetry Go SDK telah mendedahkan kos overhed yang ketara yang mencetuskan perbincangan sengit dalam kalangan pembangun mengenai strategi pengoptimuman dan pendekatan alternatif. Ujian ini, yang mengukur pelayan HTTP ringkas yang mengendalikan 10,000 permintaan sesaat, menunjukkan kesan prestasi yang jelas apabila ciri-ciri kebolehcerapan penuh diaktifkan.

Keputusan penanda aras ini telah menarik perhatian komuniti Go , terutamanya kerana ia menyerlahkan kos dunia sebenar yang dihadapi oleh banyak pasukan semasa melaksanakan kebolehcerapan menyeluruh. Walaupun overhed ini tidak semestinya menghalang, ia cukup besar untuk menjadi penting pada skala besar.

Konfigurasi Ujian

Beban: 10,000 permintaan sesaat
Infrastruktur: 4 nod Linux (2 vCPU, 8GB RAM setiap satu)
Komponen: Pelayan HTTP Go , pangkalan data Volkey , penjana beban wrk2
Tempoh: 20 minit setiap ujian
Rangkaian: Mod rangkaian hos untuk mengelakkan overhed proksi Docker


Graf yang memaparkan penggunaan CPU dari masa ke masa, menonjolkan overhed prestasi apabila membolehkan ciri observabiliti penuh

Penggunaan CPU Melonjak 30% dengan Instrumentasi Penuh

Penemuan yang paling menarik ialah overhed CPU . Apabila penjejakan OpenTelemetry diaktifkan, penggunaan CPU meningkat daripada 2 teras kepada kira-kira 2.7 teras - lonjakan 30%. Peningkatan ini datang terutamanya daripada pemprosesan span, operasi eksport data, dan operasi terinstrumen seperti panggilan Redis , yang menyaksikan kira-kira 7% overhed tambahan.

Ahli komuniti sudah mencadangkan penyelesaian untuk mengurangkan kesan ini. Seorang pembangun telah mengenal pasti beberapa peluang pengoptimuman, termasuk menggunakan fungsi masa yang lebih pantas, menggantikan kunci mutex dengan operasi atom, dan melaksanakan marshaling buffer protokol langsung dan bukannya pendekatan berasaskan refleksi.

Pecahan Overhed CPU

Pemprosesan Span: ~10% daripada jumlah masa CPU
Operasi Redis: +7% overhed pada panggilan go-redis
Pengendali HTTP: Overhed tambahan daripada middleware yang diinstrumentasi
Alternatif eBPF: <0.2 teras overhed (jauh lebih rendah)

Kos Memori dan Rangkaian Bertambah

Selain penggunaan CPU , ujian mendedahkan kesan sumber lain. Penggunaan memori meningkat daripada 10MB kepada antara 15-50MB, manakala trafik rangkaian melonjak dengan ketara dengan 4MB sesaat data telemetri dieksport. Untuk perkhidmatan throughput tinggi atau persekitaran dengan kekangan rangkaian yang ketat, penggunaan lebar jalur tambahan ini menjadi pertimbangan sebenar.

Kesan latensi adalah lebih sederhana tetapi masih boleh diukur. Masa respons persentil ke-99 meningkat daripada 10 milisaat kepada kira-kira 15 milisaat, walaupun throughput keseluruhan kekal stabil pada sekitar 11,800 permintaan sesaat.

Ringkasan Kesan Prestasi

Penggunaan CPU: Meningkat daripada 2.0 kepada 2.7 teras (+30%)
Penggunaan Memori: Meningkat daripada ~10MB kepada 15-50MB
Trafik Rangkaian: Menambah 4MB/saat (32 Mbps) data telemetri
Latency (p99): Meningkat daripada 10ms kepada 15ms
Throughput: Kekal stabil pada ~11,800 permintaan/saat

Strategi Pensampelan Menjadi Kritikal

Perbincangan komuniti telah menyerlahkan jurang penting dalam penanda aras: ia tidak melaksanakan strategi pensampelan yang digunakan oleh kebanyakan sistem pengeluaran. Beberapa pembangun berpengalaman menegaskan bahawa menjejak setiap permintaan tunggal pada volum tinggi bukanlah realistik atau perlu.

Menjejak setiap http 200 pada 10k req/sec bukanlah sesuatu yang patut anda lakukan, pada kadar tersebut anda patut mensampel 200 (1% atau lebih kurang) dan menjejak semua ralat.

Walau bagaimanapun, melaksanakan pensampelan pintar memperkenalkan kerumitannya sendiri. Pasukan mahu menangkap semua ralat, tetapi anda tidak tahu jika permintaan akan ralat sehingga ia selesai. Ini mewujudkan masalah ayam-dan-telur yang memerlukan sistem pensampelan berasaskan ekor yang canggih.

eBPF Muncul sebagai Alternatif Ringan

Penanda aras juga menguji instrumentasi berasaskan eBPF sebagai pendekatan alternatif. Teknik pemantauan peringkat kernel ini menunjukkan overhed yang jauh lebih rendah - kekal di bawah 0.2 teras CPU walaupun di bawah beban berat. Walaupun eBPF tidak dapat menyediakan penjejakan terperinci yang sama seperti pendekatan berasaskan SDK , ia menawarkan jalan tengah praktikal untuk pasukan yang memerlukan keterlihatan tanpa kos prestasi.

Pertukaran antara kebolehcerapan terperinci dan prestasi sistem terus mencabar pasukan pembangunan. Sesetengah organisasi, terutamanya dalam perdagangan frekuensi tinggi dan ad-tech, mendapati overhed penjejakan tradisional sama sekali tidak boleh diterima, menjadikan penyelesaian berasaskan eBPF semakin menarik.

Cabaran Pengoptimuman di Hadapan

Respons komuniti menunjukkan bahawa peningkatan prestasi yang ketara adalah mungkin dengan usaha kejuruteraan yang fokus. Pembangun menunjuk kepada pelaksanaan yang berjaya dalam sistem lain, seperti sistem penjejakan TiDB yang sangat dioptimumkan, sebagai contoh apa yang boleh dicapai.

Cabaran terletak pada mengimbangi kerumitan pengoptimuman dengan kebolehselenggaraan. Walaupun operasi atom dan marshaling tersuai boleh meningkatkan prestasi, ia juga memperkenalkan pepijat halus dan overhed penyelenggaraan yang mesti dipertimbangkan dengan teliti oleh projek sumber terbuka.

Bagi kebanyakan pasukan, overhed semasa mewakili pertukaran yang boleh diurus untuk keupayaan nyahpepijat dan pemantauan yang disediakan oleh OpenTelemetry . Walau bagaimanapun, apabila aplikasi berkembang dan keperluan prestasi semakin ketat, perbincangan pengoptimuman ini berkemungkinan akan menjadi semakin penting untuk penggunaan masa depan projek ini.

Rujukan: OpenTelemetry for Go: measuring the overhead