<News_Article>
Kes ini mendedahkan dua pendekatan yang sangat berbeza yang diambil oleh Anthropic untuk mengumpul bahan latihan. Di satu pihak, syarikat itu membelanjakan jutaan dolar untuk membeli buku fizikal terpakai, yang kemudiannya mereka potong dan imbas menjadi fail digital sebelum membuang yang asal. Hakim William Alsup memutuskan proses ini sangat transformatif dan layak sebagai penggunaan adil di bawah undang-undang hak cipta.
Kaedah Pemerolehan Data Anthropic
- Pendekatan sah: Membeli berjuta-juta buku terpakai, memotong dan mengimbas buku tersebut, membuang buku asal
- Pendekatan tidak sah: Memuat turun 5 juta buku dari Library Genesis (2021) + 2 juta dari Pirate Library Mirror (2022)
- Keputusan mahkamah: Pengimbasan buku fizikal = penggunaan saksama; muat turun cetak rompak = pelanggaran hak cipta
Kemenangan Undang-undang Yang Datang Dengan Harga
Keputusan penggunaan adil hakim itu mewakili kemenangan besar untuk industri AI. Alsup membandingkan latihan AI dengan pembelajaran manusia, menyatakan bahawa orang sentiasa membaca buku, menghayati tema mereka, dan menggunakan pengetahuan itu untuk mencipta karya baru. Beliau berhujah bahawa memerlukan pembayaran setiap kali seseorang mengingat maklumat dari ingatan adalah tidak dapat difikirkan.
Walau bagaimanapun, kemenangan ini datang dengan kaveat yang ketara. Mahkamah mendapati bahawa pengasas bersama Anthropic Ben Mann dengan sengaja memuat turun sekurang-kurangnya 5 juta buku dari Library Genesis pada 2021, diikuti dengan 2 juta lagi dari Pirate Library Mirror pada 2022. Komunikasi dalaman mendedahkan syarikat lebih suka mencuri buku untuk mengelakkan kemelut undang-undang/amalan/perniagaan pelesenan yang betul.
Kisah Dua Piawaian
Keputusan itu telah mencetuskan perdebatan sengit tentang keadilan dalam penguatkuasaan hak cipta. Ramai ahli komuniti menunjukkan kontras yang ketara antara cara individu dan syarikat diperlakukan untuk pelanggaran yang serupa. Walaupun remaja menghadapi tuduhan jenayah dan denda besar kerana memuat turun muzik pada awal 2000-an, dan Aaron Swartz menghadapi pendakwaan persekutuan kerana memuat turun kertas akademik, syarikat besar nampaknya hanya menghadapi penalti sivil.
Kesan kewangan yang berpotensi adalah mengejutkan. Di bawah undang-undang hak cipta standard, ganti rugi berkanun berkisar dari 750 hingga 150,000 dolar Amerika Syarikat setiap karya untuk pelanggaran yang disengajakan. Dengan 7 juta buku yang dibajak, Anthropic secara teorinya boleh menghadapi ganti rugi melebihi 1 trilion dolar Amerika Syarikat, walaupun pakar undang-undang menjangkakan sebarang penyelesaian akhir akan jauh lebih rendah.
Penalti Pelanggaran Hak Cipta
- Ganti rugi berkanun standard: $750 - $30,000 USD setiap karya
- Ganti rugi pelanggaran sengaja: Sehingga $150,000 USD setiap karya
- Potensi liabiliti maksimum Anthropic: $1.05 trilion USD (7 juta karya × $150,000)
- Tarikh perbicaraan untuk ganti rugi: Disember 2025
Implikasi Seluruh Industri
Kes ini nampaknya hanya puncak gunung ais. Perbincangan komuniti mencadangkan bahawa kebanyakan syarikat AI utama telah bergantung pada kandungan yang dibajak untuk data latihan, dengan sesetengahnya menunjuk kepada amalan serupa di Meta, Google, dan gergasi teknologi lain. Keputusan itu menetapkan preseden yang jelas: syarikat boleh melatih model AI pada bahan berhak cipta yang mereka miliki secara sah, tetapi memuat turun kandungan yang dibajak kekal sebagai pelanggaran hak cipta tanpa mengira tujuan penggunaan.
Keputusan itu juga menyerlahkan ketegangan yang lebih luas dalam industri teknologi antara inovasi dan etika. Walaupun syarikat berhujah bahawa penguatkuasaan hak cipta yang ketat akan menghalang pembangunan AI, pengkritik mempersoalkan mengapa beberapa syarikat terkaya di dunia menggunakan pembajakan apabila mereka mampu melesenkan kandungan dengan betul.
Memandang ke Hadapan
Perbicaraan juri yang dijadualkan pada Disember 2025 akan menentukan ganti rugi sebenar yang mesti dibayar oleh Anthropic untuk buku-buku yang dibajak. Syarikat itu telah membeli salinan sah buku-buku yang terlibat dalam tuntutan mahkamah, walaupun hakim menyatakan ini tidak membebaskan mereka daripada pelanggaran masa lalu.
Keputusan itu mungkin memaksa syarikat AI untuk mempertimbangkan semula strategi pemerolehan data mereka. Sesetengah pemerhati industri mencadangkan ini boleh membawa kepada sistem dua peringkat di mana syarikat yang mempunyai dana yang mencukupi mampu pelesenan yang betul manakala pesaing yang lebih kecil dihalang daripada pasaran. Yang lain berharap ia akan menggalakkan pembangunan amalan latihan yang lebih beretika dan pampasan yang lebih baik untuk pencipta kandungan.
Semasa industri AI terus berkembang, kes ini berfungsi sebagai peringatan bahawa walaupun teknologi transformatif mesti beroperasi dalam sempadan undang-undang. Persoalannya sekarang ialah sama ada syarikat AI lain akan belajar daripada pengajaran mahal Anthropic atau terus menguji had undang-undang hak cipta.
Rujukan: Anthropic cut up millions of used books to train Claude - and downloaded over 7 million pirated ones too, a judge said </News_Article>