Reddit Menyekat Wayback Machine Internet Archive untuk Mencegah Pengikisan AI, Mengehadkan Akses kepada Kandungan Bersejarah

Pasukan Editorial BigGo
Reddit Menyekat Wayback Machine Internet Archive untuk Mencegah Pengikisan AI, Mengehadkan Akses kepada Kandungan Bersejarah

Pemeliharaan sejarah internet menghadapi kemunduran yang ketara apabila Reddit melaksanakan sekatan baharu yang akan mengehadkan keupayaan Internet Archive untuk menangkap dan menyimpan kandungan platform tersebut dengan teruk. Langkah ini mewakili ketegangan yang semakin meningkat antara platform kandungan yang berusaha untuk memonetisasi data mereka dan misi yang lebih luas untuk memelihara maklumat digital bagi generasi akan datang.

Logo Reddit pada telefon pintar melambangkan sekatan baharu platform tersebut terhadap pengarkiban kandungan
Logo Reddit pada telefon pintar melambangkan sekatan baharu platform tersebut terhadap pengarkiban kandungan

Kawalan Kandungan Strategik Reddit

Reddit telah mengumumkan bahawa ia akan menyekat Wayback Machine daripada mengindeks kebanyakan kandungannya, membenarkan akses hanya kepada laman utama platform tersebut. Keputusan ini secara berkesan menjadikan petikan bersejarah Internet Archive bagi subreddit dan pos individu tidak dapat diakses untuk pengarkiban masa depan. Sekatan ini berpunca daripada kebimbangan Reddit bahawa syarikat AI memintas dasar akses kandungan platform dengan mengikis data daripada versi yang diarkibkan yang disimpan dalam Wayback Machine.

Menurut jurucakap Reddit Tim Rathschmidt, syarikat telah mengenal pasti kejadian di mana syarikat AI melanggar dasar platform dengan mengekstrak data latihan daripada tangkapan Internet Archive. Had baharu ini mula meningkat baru-baru ini, walaupun kandungan yang diarkibkan sedia ada nampaknya kekal boleh diakses buat masa ini.

Perubahan Akses kepada Internet Archive

  • Sebelum: Akses penuh kepada siaran Reddit , subreddit , dan laman utama
  • Selepas: Akses terhad kepada laman utama Reddit sahaja
  • Arkib Sedia Ada: Pada masa ini masih boleh diakses

Faktor Monetisasi AI

Masa keputusan ini mendedahkan strategi yang lebih luas Reddit mengenai perkongsian AI dan pelesenan kandungan. Platform ini telah pun memperoleh tawaran yang menguntungkan dengan syarikat AI utama, termasuk perjanjian 2024 dengan Google dan perkongsian berikutnya dengan OpenAI. Pengaturan ini membolehkan gergasi teknologi mengakses repositori besar kandungan yang dijana pengguna Reddit secara sah untuk melatih model kecerdasan buatan mereka.

Pendekatan ini menunjukkan kebimbangan utama Reddit bukanlah mencegah latihan AI sepenuhnya, tetapi memastikan ia menerima pampasan untuk akses tersebut. Syarikat nampaknya menutup kelemahan berpotensi yang membolehkan pembangun AI lain memperoleh kandungan Reddit tanpa membayar yuran pelesenan.

Garis Masa Perkongsian AI Reddit

  • 2024: Perjanjian pelesenan kandungan dengan Google
  • Lewat 2024: Perjanjian perkongsian dengan OpenAI
  • 2025: Pelaksanaan sekatan Wayback Machine

Kesan kepada Pemeliharaan Digital

Internet Archive, sebuah organisasi bukan untung yang berdedikasi untuk memelihara maklumat digital, menyediakan perkhidmatan yang tidak ternilai melalui Wayback Machine-nya. Alat ini secara sejarahnya membolehkan penyelidik, wartawan, dan pengguna yang ingin tahu mengakses laman web dan kandungan yang mungkin hilang ditelan masa. Sekatan Reddit mewakili tamparan hebat kepada misi ini, memandangkan peranan platform sebagai repositori besar perbincangan, ulasan, dan pengetahuan komuniti.

Kehilangan ini amat ketara bagi pengguna yang bergantung kepada Reddit untuk maklumat tulen yang dijana manusia. Ramai pengguna internet telah membangunkan tabiat menambah Reddit pada pertanyaan carian untuk mencari pendapat dan pengalaman tulen, menjadikan kandungan Reddit yang diarkibkan sebagai sumber yang berharga untuk mengakses pos yang dipadam atau diubah suai.

Rundingan Berterusan

Walaupun terdapat sekatan semasa, mungkin ada harapan untuk penyelesaian. Mark Graham, pengarah Wayback Machine, menunjukkan bahawa Internet Archive mengekalkan hubungan lama dengan Reddit dan meneruskan perbincangan mengenai perkara tersebut. Ini menunjukkan kemungkinan mencari jalan tengah yang boleh memelihara beberapa akses arkib sambil menangani kebimbangan Reddit mengenai pengikisan AI tanpa kebenaran.

Situasi ini menyerlahkan cabaran kompleks yang dihadapi pemeliharaan digital dalam era di mana platform kandungan semakin melihat data yang dijana pengguna mereka sebagai aset komersial yang berharga. Memandangkan syarikat AI terus mencari data latihan, konflik serupa antara usaha pemeliharaan dan kepentingan komersial mungkin menjadi lebih biasa di seluruh internet.