Perplexity AI Mengabaikan Peraturan Penyekatan Laman Web Walaupun Terdapat Tuntutan Dokumentasi

Pasukan Komuniti BigGo
Perplexity AI Mengabaikan Peraturan Penyekatan Laman Web Walaupun Terdapat Tuntutan Dokumentasi

Ancaman undang-undang BBC terhadap Perplexity AI telah mencetuskan perbincangan sengit dalam komuniti, tetapi pakar teknologi memberi tumpuan kepada penemuan yang lebih membimbangkan: bukti bahawa syarikat AI tersebut telah secara senyap-senyap mengubah polisinya mengenai menghormati peraturan penyekatan laman web.

Perubahan Dokumentasi Mendedahkan Peralihan Polisi

Analisis komuniti telah mendedahkan bahawa Perplexity baru-baru ini mengubah suai dokumentasi teknikalnya antara 30 Januari dan 7 Februari 2025. Syarikat tersebut menambah kenyataan penting mengenai perangkak Perplexity-User nya: Memandangkan pengguna meminta pengambilan tersebut, pengambil ini secara amnya mengabaikan peraturan robots.txt. Penambahan ini berlaku ketika tekanan undang-undang daripada penerbit utama semakin meningkat.

Fail robots.txt adalah protokol web standard yang memberitahu perangkak automatik bahagian mana laman web yang harus mereka elakkan. Ia seperti papan tanda Dilarang Masuk untuk bot, walaupun pematuhan kekal secara sukarela. BBC menggunakan fail ini untuk menyekat perangkak Perplexity , tetapi syarikat AI tersebut nampaknya telah mengabaikan arahan ini.

Garis Masa Perubahan Dokumentasi:

  • 30 Januari 2025: Dokumentasi Perplexity tidak menyebut tentang mengabaikan robots.txt
  • 7 Februari 2025: Menambah kenyataan bahawa Perplexity-User "secara amnya mengabaikan peraturan robots.txt"

Teknologi RAG di Pusat Pertikaian

Kontroversi ini berpusat pada Retrieval-Augmented Generation (RAG), teknologi yang mencari web secara masa nyata untuk menjawab soalan pengguna. Tidak seperti enjin carian tradisional yang menunjukkan pautan ke sumber asal, Perplexity memaparkan kandungan secara langsung dalam antara mukanya, sering kali menghasilkan semula bahagian besar artikel.

Pendekatan ini telah menarik kritikan daripada penerbit yang berhujah ia mengurangkan trafik ke laman web mereka sambil masih menggunakan kandungan mereka. BBC mendakwa Perplexity menghasilkan semula kandungannya secara verbatim tanpa kebenaran, berpotensi menjejaskan hubungan perbadanan dengan pembayar yuran lesen UK yang membiayai operasinya.

Jenis-jenis Perangkak Perplexity:

  • PerplexityBot: Direka untuk memaparkan dan memautkan laman web dalam hasil carian (disekat oleh robots.txt BBC )
  • Perplexity-User: Mengambil kandungan apabila pengguna bertanya soalan (kini didokumenkan sebagai mengabaikan peraturan robots.txt)

Persoalan Skala dan Penggunaan Adil

Perdebatan komuniti telah menyerlahkan persoalan asas mengenai hak digital dalam era AI. Walaupun individu boleh dengan bebas melayari dan meringkaskan kandungan web, sistem AI beroperasi pada skala besar, berpotensi memproses berjuta-juta artikel setiap hari.

Hak cipta secara intrinsik dikaitkan dengan skala. Melipatgandakan penggunaan adil sebanyak 1000000 kali... mungkin tidak lagi penggunaan adil.

Kesan penskalaan ini menimbulkan kebimbangan mengenai kemampanan jangka panjang kewartawanan. Jika sistem AI boleh menyediakan ringkasan tanpa memacu trafik ke sumber asal, penerbit bimbang kehilangan hasil yang diperlukan untuk membiayai pengumpulan berita dan pelaporan.

Impak Industri Penerbitan UK:

  • Nilai industri: £4.4 bilion GBP
  • Pekerjaan: 55,000 orang
  • Badan perwakilan: Professional Publishers Association (300+ jenama media)

Reaksi Pengguna Bercampur

Walaupun terdapat kebimbangan undang-undang, ramai pengguna menghargai keupayaan Perplexity untuk mengatasi laman web yang sesak dengan iklan dan kandungan yang dioptimumkan SEO. Sesetengah melihat perkhidmatan ini sebagai penyelesaian kepada pengalaman web yang merosot akibat daripada strategi monetisasi yang agresif.

Walau bagaimanapun, kemudahan ini datang dengan kos kepada pencipta kandungan yang bergantung pada lawatan laman web untuk hasil. Ketegangan antara pengalaman pengguna dan kemampanan penerbit kekal tidak diselesaikan ketika pertempuran undang-undang berlangsung.

Tindakan BBC mewakili cabaran undang-undang utama pertama daripada organisasi berita global terhadap syarikat AI mengenai penggunaan kandungan. Hasilnya boleh menetapkan preseden penting untuk cara sistem AI berinteraksi dengan bahan berhak cipta dan sama ada perlindungan penggunaan adil semasa secukupnya menangani skala operasi AI moden.

Rujukan: BBC threatens AI firm with legal action over unauthorised content use

Seorang pengguna berinteraksi dengan telefon pintar, mewakili penglibatan dengan teknologi AI di tengah-tengah perdebatan berterusan tentang penggunaan kandungan dan kemampanan penerbit
Seorang pengguna berinteraksi dengan telefon pintar, mewakili penglibatan dengan teknologi AI di tengah-tengah perdebatan berterusan tentang penggunaan kandungan dan kemampanan penerbit