Latihan AI Menggunakan Buku Berhak Cipta Mencetuskan Perdebatan Penggunaan Saksama Ketika Anthropic Meraih Kemenangan Separa

Pasukan Komuniti BigGo

Latihan AI Menggunakan Buku Berhak Cipta Mencetuskan Perdebatan Penggunaan Saksama Ketika Anthropic Meraih Kemenangan Separa

Keputusan mahkamah baru-baru ini yang memihak kepada Anthropic telah mencetuskan semula perbincangan mengenai sama ada syarikat AI boleh secara sah melatih model mereka menggunakan kandungan berhak cipta. Walaupun syarikat tersebut memenangi kemenangan separa untuk operasi pengimbasan buku mereka, kes ini mendedahkan persoalan yang lebih mendalam tentang bagaimana undang-undang hak cipta terpakai kepada kecerdasan buatan di era digital.

Pertempuran undang-undang ini berpunca daripada hari-hari awal Anthropic ketika syarikat yang diasaskan oleh bekas penyelidik OpenAI ini memuat turun berjuta-juta buku cetak rompak untuk melatih model AI mereka. Antara tahun 2021 dan 2022, mereka memperolehi lebih daripada 7 juta salinan tanpa kebenaran daripada laman web pembajakan terkenal termasuk Books3 , Library Genesis , dan Pirate Library Mirror . Kemudiannya, syarikat tersebut beralih kepada pendekatan yang lebih sah dengan membelanjakan berjuta-juta dolar Amerika Syarikat untuk membeli dan mengimbas buku fizikal.

Garis Masa Pemerolehan Buku Anthropic:

Januari-Februari 2021: Memuat turun Books3 (196,640 buku cetak rompak)
Jun 2021: Memuat turun 5+ juta buku dari Library Genesis
Julai 2022: Memuat turun 2+ juta buku dari Pirate Library Mirror
Februari 2024: Mengupah bekas ketua perkongsian pengimbasan buku Google
2024: Membeli dan mengimbas berjuta-juta buku fizikal dengan kos berjuta-juta USD

Analogi Manusia-AI Diserang

Keputusan Hakim William Alsup membuat perbandingan antara pembelajaran manusia dan latihan AI, dengan berhujah bahawa sebagaimana manusia membaca buku dan menggunakan kandungannya dalam penulisan mereka, model AI sepatutnya mempunyai hak yang sama. Walau bagaimanapun, perbandingan ini telah mencetuskan perdebatan sengit dalam komuniti teknologi.

Pengkritik berhujah bahawa antropomorfisasi ini terlepas pandang perkara penting tentang skala dan kelajuan. Isu asasnya bukanlah sama ada AI boleh belajar daripada buku, tetapi sama ada undang-undang penggunaan saksama sedia ada dapat mengendalikan skala besar-besaran di mana sistem ini beroperasi. Tidak seperti manusia yang mungkin membaca beratus-ratus buku sepanjang hayat, model AI boleh memproses berjuta-juta karya secara serentak dan menjawab pertanyaan yang tidak terkira banyaknya dengan serta-merta.

Tetapi untuk membuat sesiapa pun membayar secara khusus untuk penggunaan sebuah buku setiap kali mereka membacanya, setiap kali mereka mengingatnya dari ingatan, setiap kali mereka kemudiannya menggunakannya ketika menulis perkara baru dengan cara baru adalah tidak dapat difikirkan.

Skala Mengubah Segalanya

Perbincangan komuniti mendedahkan kebimbangan utama: kelajuan dan skala secara asasnya mengubah landskap undang-undang. Ramai yang menunjukkan bahawa penggunaan saksama direka untuk aktiviti berskala manusia, bukan pemprosesan data berskala industri. Apabila sistem AI boleh mengingat dan mensintesis maklumat daripada berjuta-juta karya berhak cipta dengan serta-merta, ia berpotensi melemahkan insentif ekonomi yang hak cipta dimaksudkan untuk melindungi.

Ada yang membandingkan ini dengan bidang lain di mana skala mengubah kesahihan. Laman web yang mengalami trafik organik daripada media sosial tidak melanggar sebarang undang-undang, tetapi jumlah permintaan automatik yang sama akan menjadi serangan DDoS. Perbezaannya bukan sahaja terletak pada niat, tetapi pada keupayaan teknologi yang memungkinkan skala sedemikian.

Ringkasan Keputusan Mahkamah:

Kemenangan Penggunaan Adil: Operasi pengimbasan buku dianggap transformatif dan dilindungi
Liabiliti Pembajakan: Bahan yang dimuat turun secara haram tidak dilindungi oleh penggunaan adil
Langkah Seterusnya: Perbicaraan juri menunggu untuk muat turun buku yang dibajak
Preseden Undang-undang: Keputusan utama pertama mengenai penggunaan adil data latihan AI

Keputusan Undang-undang Bercampur

Keputusan mahkamah adalah bernuansa, mendapati bahawa operasi pengimbasan buku Anthropic kemudiannya layak sebagai penggunaan saksama kerana ia bersifat transformatif dan disimpan secara dalaman. Walau bagaimanapun, muat turun bahan cetak rompak sebelum ini tidak menerima perlindungan yang sama dan berkemungkinan akan menghadapi perbicaraan juri.

Keputusan berpecah ini menyerlahkan kerumitan menerapkan konsep hak cipta tradisional kepada pembangunan AI. Walaupun syarikat berpotensi boleh menuntut penggunaan saksama untuk latihan AI yang transformatif, mereka tidak boleh begitu sahaja mengabaikan hak cipta dengan menggunakan bahan cetak rompak sebagai data sumber.

Keputusan ini menetapkan duluan penting, tetapi ia masih jauh daripada kata putus. Dengan kes serupa yang belum selesai terhadap syarikat AI utama yang lain, dan bidang kuasa berbeza berpotensi mencapai kesimpulan berbeza, landskap undang-undang untuk data latihan AI kekal tidak menentu. Industri teknologi akan memerhati dengan teliti ketika kes-kes ini berkembang, mengetahui bahawa hasilnya boleh membentuk semula cara sistem AI dibangunkan dan digunakan.

Rujukan: Anthropic wins a major fair use victory for Al - but it's still in trouble for stealing books