Pemfailan mahkamah terkini telah mendedahkan amalan kontroversi oleh syarikat AI Anthropic , yang menunjukkan bahawa firma tersebut secara fizikal memusnahkan berjuta-juta buku semasa proses latihan untuk model bahasa Claude mereka. Pendedahan ini telah mencetuskan perdebatan mengenai kaedah yang digunakan oleh syarikat-syarikat untuk memperoleh data latihan bagi sistem kecerdasan buatan dan sempadan undang-undang yang mengelilingi hak cipta dan penggunaan adil.
![]() |
---|
Transformasi daripada buku fizikal kepada maklumat digital digambarkan melalui imej buku merah yang mengeluarkan kod binari, mencerminkan kaedah pemusnahan Anthropic untuk latihan AI |
Proses Pengimbasan Pemusnah Menelan Kos Berjuta-juta
Dokumen mahkamah menunjukkan bahawa Anthropic membelanjakan berjuta-juta dolar Amerika untuk membeli buku fizikal, yang kemudiannya tertakluk kepada proses pengimbasan pemusnah. Syarikat tersebut secara sistematik mengeluarkan jilidanbuku, mengimbas halaman ke dalam fail PDF yang boleh dibaca mesin, dan seterusnya membuang salinan kertas asal. Pendekatan ini dipilih untuk mempercepatkan proses pendigitalan yang diperlukan untuk menyuap algoritma latihan Claude dengan data teks berkualiti tinggi.
Skala operasi ini adalah besar-besaran, dengan berjuta-juta jilid diproses melalui kaedah pemusnah ini. Anthropic menyasarkan terutamanya buku terpakai daripada saluran runcit, mengelakkan keperluan untuk rundingan pelesenan yang kompleks dengan penerbit. Pendekatan syarikat tersebut dipengaruhi oleh doktrin jualan pertama Amerika Syarikat, yang membenarkan pembeli buku fizikal untuk melupuskannya mengikut kehendak mereka selepas pemerolehan.
Proses Pengimbasan Musnah:
- Berjuta-juta buku fizikal dibeli dan dimusnahkan
- Proses melibatkan penyingkiran jilidan, pengimbasan halaman, pembuangan buku asal
- Kos: Beberapa juta USD
- Sasaran: Terutamanya buku terpakai daripada saluran runcit
Pengambilan Strategik dan Preseden Undang-undang
Pada Februari 2024, Anthropic mengupah Tom Turvey , yang sebelum ini menguruskan perkongsian untuk Google Books , secara khusus menugaskannya untuk memperoleh buku dari seluruh dunia. Pelantikan strategik ini menunjukkan syarikat tersebut berhasrat untuk meniru model pendigitalan buku Google yang berjaya secara undang-undang, yang mana mahkamah sebelum ini telah memutuskan bahawa ia merupakan penggunaan adil.
Keputusan pengambilan pekerja tersebut terbukti tepat apabila Hakim William Alsup memutuskan bahawa kaedah pengimbasan Anthropic merupakan penggunaan adil. Alasan hakim tersebut berpusat kepada beberapa faktor: buku-buku tersebut dibeli secara sah, segera dimusnahkan selepas pengimbasan, dan fail digital kekal untuk kegunaan dalaman sahaja tanpa pengedaran luaran. Beliau menyifatkan proses ini sebagai transformasi digital penjimatan ruang dengan ciri-ciri transformatif yang mencukupi untuk layak mendapat perlindungan penggunaan adil.
Kemenangan Undang-undang Bercampur dengan Cabaran Berterusan
Walaupun Anthropic mencapai kemenangan undang-undang separa, keputusan mahkamah tidak sepenuhnya menguntungkan. Hakim memutuskan menentang syarikat tersebut kerana pergantungan awal mereka kepada perpustakaan e-book cetak rompak semasa pembangunan Claude . Ketua Pegawai Eksekutif Dario Amodei pada mulanya menyokong penggunaan kandungan cetak rompak untuk memintas proses pelesenan yang panjang, keputusan yang kini menjejaskan kedudukan undang-undang syarikat tersebut.
Keputusan bercampur ini bermakna Anthropic masih menghadapi perbicaraan hak cipta yang dijadualkan pada Disember 2024, di mana syarikat tersebut boleh menghadapi penalti sehingga 150,000 dolar Amerika bagi setiap karya cetak rompak yang digunakan dalam latihan. Kes ini menyerlahkan ketegangan antara keperluan syarikat AI untuk jumlah data latihan yang besar dan perlindungan hak cipta sedia ada.
Hasil Undang-undang Utama:
- Kemenangan separa untuk Anthropic mengenai pengimbasan buku di bawah doktrin penggunaan saksama
- Keputusan menentang Anthropic kerana menggunakan perpustakaan e-book cetak rompak
- Perbicaraan hak cipta akan datang pada Disember 2024 dengan penalti berpotensi sehingga USD 150,000 bagi setiap karya cetak rompak
Implikasi Seluruh Industri untuk Pembangunan AI
Pendedahan mengenai pemusnahan buku datang di tengah-tengah penelitian yang lebih luas terhadap kesan alam sekitar AI generatif dan amalan hak cipta. Pendekatan alternatif wujud, seperti teknologi pengimbasan tanpa pemusnah yang dibangunkan oleh Internet Archive , yang memelihara buku asal sambil mencipta salinan digital. OpenAI dan Microsoft juga telah mengumumkan perkongsian dengan Harvard University Library untuk menggunakan hampir satu juta buku domain awam untuk latihan AI sambil mengekalkan pemeliharaan yang betul bagi jilid fizikal.
Kes ini mewujudkan preseden yang berpotensi penting untuk industri AI, kerana ia mungkin membenarkan syarikat-syarikat melatih model pada bahan berhak cipta tanpa pemberitahuan penerbit, dengan syarat mereka mengikuti metodologi beli-dan-musnahkan Anthropic . Walau bagaimanapun, pertempuran hak cipta yang berterusan di seluruh industri terus menimbulkan risiko yang besar, dengan kes-kes yang melibatkan Getty Images dan tuntutan mahkamah Disney terhadap Midjourney berpotensi membentuk semula landskap undang-undang untuk pembangunan AI generatif.