Trafik Bot AI Membebankan Laman Web Kecil Ketika Cloudflare Mencadangkan Penyelesaian Kontroversi "Signed Agents"

Pasukan Komuniti BigGo
Trafik Bot AI Membebankan Laman Web Kecil Ketika Cloudflare Mencadangkan Penyelesaian Kontroversi "Signed Agents"

Pemilik laman web kecil sedang menghadapi krisis yang semakin meningkat apabila perangkak AI yang agresif daripada syarikat-syarikat besar seperti OpenAI , Meta , dan Perplexity menggunakan sejumlah besar sumber pelayan. Bot-bot ini sering mengabaikan peraturan etika web tradisional seperti fail robots.txt dan membebankan tapak dengan beratus-ratus permintaan sesaat, memaksa sesetengah pengendali untuk mengambil kandungan mereka secara luar talian sepenuhnya.

Masalah ini telah menjadi begitu teruk sehingga seorang pemilik laman web melaporkan 1.6 terabait data diakses oleh bot dalam sebulan, dengan 1.3 juta permintaan harian. Seorang lagi menggambarkan bot AI menghasilkan 200-300 permintaan sesaat sambil berhalusinasi URL seperti orang gila di tapak pemasaran yang lebih kecil. Tidak seperti perangkak enjin carian yang berkelakuan baik daripada Google atau Bing yang menghormati had kadar dan keutamaan laman web, pengikis AI ini sering menukar ejen pengguna dan alamat IP untuk memintas sekatan.

Contoh Kesan Trafik Bot AI:

  • 1.6 TB data diakses dalam satu bulan oleh bot pada satu laman web
  • 1.3 juta permintaan bot setiap hari
  • 200-300 permintaan sesaat pada laman web pemasaran kecil
  • Kos pemindahan data AWS boleh mencecah $30,000 USD untuk penggunaan bulanan 330TB
  • Sesetengah laman web terpaksa ditutup kerana kos lebar jalur melebihi $50-100 USD bulanan

Cadangan Penyelesaian Cloudflare Mencetuskan Perdebatan

Sebagai tindak balas kepada krisis ini, Cloudflare telah memperkenalkan sistem ejen bertandatangan yang akan mencipta senarai kebenaran bot AI yang diluluskan. Di bawah cadangan ini, syarikat AI perlu mendaftar dengan Cloudflare dan menerima tandatangan kriptografi untuk mengakses laman web yang mengambil bahagian. Pemilik tapak kemudiannya boleh memilih untuk menyekat semua trafik bot yang tidak disahkan sambil membenarkan ejen yang diluluskan melalui.

Walau bagaimanapun, penyelesaian ini telah mendapat kritikan tajam daripada pembangun dan penyokong web terbuka yang berhujah ia mencipta duluan yang berbahaya. Pengkritik bimbang bahawa memerlukan pendaftaran dengan satu syarikat untuk mengakses laman web secara asasnya mengubah sifat internet terbuka. Mereka menunjukkan contoh sejarah di mana kawalan berpusat membawa kepada genangan inovasi, membandingkannya dengan percubaan Microsoft yang gagal untuk mengawal piawaian web pada tahun 1990-an.

Cabaran Teknikal Melangkaui Had Kadar Mudah

Skala masalah melangkaui apa yang dapat dikendalikan oleh penyelesaian tradisional. Had kadar asas mengikut alamat IP terbukti tidak berkesan apabila syarikat AI menggunakan proksi kediaman berputar dan rangkaian teragih yang merangkumi beribu-ribu alamat IP. Malah sistem caching yang canggih bergelut apabila bot mengabaikan pengepala cache dan berulang kali mengambil kandungan yang sama.

Kos lebar jalur sahaja memaksa pengendali laman web mencari perlindungan. Pembekal awan seperti AWS mengenakan bayaran yang besar untuk pemindahan data, dengan beberapa anggaran mencadangkan bahawa serangan bot yang diselaraskan boleh menghasilkan puluhan ribu dolar Amerika Syarikat dalam caj yang tidak dijangka. Bagi blogger kecil dan pencipta kandungan, kos ini boleh menjadikan pengehosan mustahil dari segi kewangan.

Komuniti Mencari Alternatif Terbuka

Ramai dalam komuniti teknikal mendesak penyelesaian terdesentralisasi yang tidak bergantung pada satu penjaga pintu. Alternatif yang dicadangkan termasuk rantai delegasi kriptografi di mana laman web boleh mengesahkan ketulenan bot melalui rekod DNS dan infrastruktur kunci awam, serupa dengan cara pengesahan e-mel berfungsi hari ini. Ini akan membolehkan pemilik tapak membuat keputusan mereka sendiri tentang bot mana yang dibenarkan tanpa memerlukan pendaftaran dengan mana-mana pihak berkuasa pusat.

Anda menjadikan permintaan tidak disahkan cukup murah sehingga anda tidak peduli tentang volum. Simpan had kadar untuk pengguna yang disahkan di mana anda mempunyai identiti sebenar. Web terbuka bertahan dengan benar-benar percuma untuk dilayani, bukan dengan cuba meneka siapa yang 'sebenar.'

Sesetengah pembangun juga meneroka sistem bukti kerja di mana bot perlu menyelesaikan teka-teki pengiraan sebelum mengakses kandungan, menjadikan pengikisan berskala besar lebih mahal sambil kekal boleh diakses oleh pengguna yang sah dan sistem automatik yang berkelakuan baik.

Penyelesaian Teknikal yang Dicadangkan:

  • Cloudflare Signed Agents - Senarai putih berpusat yang memerlukan pendaftaran
  • Pengesahan berasaskan DNS - Menggunakan kriptografi kunci awam melalui rekod DNS
  • Sistem bukti kerja - Teka-teki pengiraan untuk menjadikan pengikisan data mahal
  • Sijil X.509 - Rantaian delegasi untuk akses yang dibenarkan
  • Alternatif sumber terbuka - Projek seperti Anubis untuk perlindungan yang dihoskan sendiri

Masa Depan Akses Web

Perdebatan mencerminkan ketegangan yang lebih luas antara mengekalkan web terbuka dan melindungi pencipta kandungan daripada eksploitasi. Walaupun syarikat AI berhujah alat mereka memberikan nilai kepada pengguna, pemilik laman web semakin merasakan mereka mensubsidi syarikat berbilion dolar tanpa pampasan. Cabaran terletak pada mencari penyelesaian yang mengekalkan sifat terbuka web sambil memberikan pemilik tapak kawalan yang bermakna ke atas sumber mereka.

Semasa situasi ini berkembang, pilihan yang dibuat hari ini boleh menentukan sama ada internet kekal sebagai platform terdesentralisasi untuk inovasi atau berkembang menjadi siri taman berdinding yang dikawal oleh beberapa syarikat besar. Komuniti teknikal terus bekerja pada piawaian terbuka yang boleh memberikan faedah pengesahan bot tanpa risiko kawalan berpusat.

Rujukan: The Web Does Not Need Gatekeepers