Pemilik Laman Web Menggunakan Langkah Anti-Bot Ekstrem Ketika Trafik Perangkak AI Melonjak 10 Kali Ganda

Pasukan Komuniti BigGo
Pemilik Laman Web Menggunakan Langkah Anti-Bot Ekstrem Ketika Trafik Perangkak AI Melonjak 10 Kali Ganda

Web sedang menghadapi gelombang trafik automatik yang tidak pernah berlaku sebelum ini ketika syarikat AI berlumba-lumba mengumpul data latihan untuk model bahasa mereka. Pemilik laman web di seluruh internet melaporkan lonjakan dramatik dalam trafik bot, dengan sesetengahnya menyaksikan peningkatan sehingga 10 kali ganda daripada kiraan pelawat biasa mereka. Lonjakan ini telah memaksa ramai untuk melaksanakan langkah-langkah penyekatan yang agresif yang secara tidak sengaja menjejaskan pengguna yang sah.

Skala Masalah

Angka-angka menunjukkan gambaran yang jelas tentang betapa teruknya isu ini. Laman web kecil dengan 300-3,000 tontonan harian melaporkan bahawa sekurang-kurangnya 70% daripada trafik mereka kini bukan manusia. Pengendali forum menggambarkan peningkatan mendadak 10 kali ganda dalam trafik bot yang tidak seperti apa yang pernah mereka lihat sebelum ini. Pelayan peribadi yang menjalankan alat pembangunan seperti Jenkins dan Gerrit sedang ditenggelami oleh perangkak yang mengabaikan fail robots.txt dan menghentam aplikasi yang memerlukan sumber intensif sehingga ia ranap.

Perangkak-perangkak ini semakin canggih dalam percubaan mereka untuk kelihatan sah. Mereka menggunakan perkhidmatan proksi kediaman untuk menyamarkan asal komersial mereka, berputar melalui berjuta-juta alamat IP, dan menggunakan agen pengguna pelayar lama untuk berbaur dengan trafik biasa. Sesetengahnya bahkan menggunakan entri DNS palsu yang mendakwa sebagai bot enjin carian yang sah.

Statistik Kesan Trafik:

  • Laman web kecil (300-3,000 tontonan harian): ~70% trafik bukan manusia
  • Peningkatan trafik forum: Sehingga 10 kali ganda paras normal
  • Kesan sumber pelayan: Penggunaan CPU mencecah 500% pada sistem yang terjejas

Melanggar Kontrak Sosial

Apa yang menjadikan situasi ini amat membimbangkan ialah bagaimana ia melanggar peraturan tidak bertulis yang telah memastikan web berfungsi selama beberapa dekad. Internet dibina atas kerjasama dan perjanjian tersirat antara pihak yang berbeza. Pemilik laman web menyediakan kandungan percuma, enjin carian merangkak dengan hormat, dan pengguna terlibat secara tulen dengan bahan tersebut.

Satu perkara yang saya rasakan daripada semua ini ialah web semasa sangat rapuh mengejutkan. Sebahagian besar web nampaknya telah disokong oleh pemahaman dan tawar-menawar tersirat, bukan oleh teknologi.

Keruntuhan ini melangkaui sekadar perangkakan web. Corak yang sama iaitu mengabaikan kontrak sosial muncul dalam pelbagai aspek masyarakat moden, daripada manuver politik kepada amalan perniagaan, menjadikan kehidupan lebih sukar untuk semua yang terlibat.

Kerosakan Sampingan untuk Pengguna Sebenar

Langkah-langkah pertahanan yang dilaksanakan oleh laman web untuk melindungi diri mereka mencipta masalah baru untuk pelawat yang sah. Sistem anti-bot kini menyekat pengguna dengan pelayar lama, perkhidmatan arkib bergelut untuk memelihara kandungan, dan bahkan versi pelayar semasa kadang-kadang mencetuskan positif palsu. CAPTCHA, pengehadan kadar, dan langkah keselamatan lain menjadikan pelayaran lebih menyusahkan untuk semua orang.

Ini mencipta kitaran ganas di mana pengalaman pengguna yang buruk mendorong orang ke arah chatbot AI untuk mendapatkan maklumat, yang seterusnya meningkatkan permintaan untuk perangkakan yang menyebabkan masalah ini pada mulanya. Situasi ini mencerminkan hari-hari awal cetak rompak media, di mana pilihan sah yang menyusahkan mendorong pengguna ke arah alternatif haram.

Cabaran Teknikal dan Penyelesaian

Mengenal pasti dan menyekat perangkak berniat jahat telah menjadi semakin sukar. Kaedah tradisional seperti menyekat julat IP pembekal awan berfungsi untuk kes yang jelas, tetapi rangkaian proksi kediaman menjadikan pengesanan lebih sukar. Sesetengah laman web sedang bereksperimen dengan sistem bukti kerja yang memerlukan pelayar melakukan tugas pengiraan sebelum mengakses kandungan.

Penyelesaian yang paling berkesan pada masa ini melibatkan perkhidmatan seperti Cloudflare, yang boleh menganalisis corak trafik secara masa nyata dan menyekat seluruh rangkaian IP berniat jahat. Walau bagaimanapun, penyelesaian ini sering datang dengan kos yang sukar ditanggung oleh pengendali laman web yang lebih kecil.

Tingkah Laku Perangkak Biasa:

  • Menggunakan agen pengguna Chrome lama untuk kelihatan sah
  • Bergilir-gilir melalui berjuta-juta alamat IP kediaman
  • Mengabaikan fail robots.txt sepenuhnya
  • Menyasarkan halaman yang memerlukan sumber intensif seperti hasil carian dan acara kalendar
  • Berasal dari blok IP yang diedarkan untuk mengelakkan pengesanan

Memandang ke Hadapan

Situasi semasa menyerlahkan soalan asas tentang masa depan web. Dengan model pengiklanan tradisional di bawah tekanan dan kos perangkakan meningkat di luar kawalan, ramai meramalkan bahawa micropayment atau model langganan mungkin perlu untuk mengakses kandungan berkualiti dalam talian.

Cabaran terletak pada mencipta sistem yang boleh membezakan antara penyelidikan yang sah, usaha pengarkiban, dan penuaian data komersial sambil mengekalkan sifat terbuka yang menjadikan web berharga pada mulanya. Tanpa rangka kerja teknikal dan undang-undang yang baru, kontrak sosial tersirat yang membina internet mungkin perlu digantikan dengan perjanjian yang lebih eksplisit dan boleh dikuatkuasakan.

Rujukan: You're using a suspiciously old browser