Keputusan undang-undang yang penting telah memberikan keputusan bercampur-campur untuk syarikat AI Anthropic, mewujudkan preseden penting untuk cara syarikat kecerdasan buatan boleh memperoleh data latihan secara sah sambil menyerlahkan ketegangan berterusan antara perlindungan hak cipta dan pembangunan AI.
Mahkamah Mewujudkan Preseden Penggunaan Adil untuk Latihan AI
Hakim mahkamah persekutuan San Francisco William Alsup memutuskan pada hari Isnin bahawa penggunaan Anthropic terhadap bahan berhak cipta untuk melatih model bahasa besar Claude nya merupakan penggunaan adil di bawah undang-undang hak cipta AS. Hakim tersebut menyifatkan output model AI yang dilatih menggunakan bahan berhak cipta sebagai sangat transformatif, membuat perbandingan antara sistem AI dan penulis manusia yang belajar daripada karya sedia ada. Hakim Alsup menulis bahawa model AI Anthropic dilatih menggunakan karya bukan untuk berlumba ke hadapan dan mereplikasi atau menggantikannya — tetapi untuk mengambil sudut yang keras dan mencipta sesuatu yang berbeza.
Preseden Undang-undang Utama
- Keputusan penggunaan adil: Latihan AI menggunakan bahan berhak cipta dianggap "transformatif secara mendasar"
- Perbezaan pembajakan: Pemerolehan secara sah diperlukan, walaupun untuk tujuan penggunaan adil
- Pengimbasan pemusnah: Boleh diterima secara sah apabila buku dibeli dan dimusnahkan serta-merta
![]() |
---|
Aplikasi " Claude " oleh Anthropic , yang menjadi pusat kepada keputusan penggunaan saksama terkini berkaitan data latihan AI |
Dakwaan Pembajakan Masih Memerlukan Penyelesaian Undang-undang
Walaupun meraih kemenangan penggunaan adil, Anthropic mesti kembali ke mahkamah pada bulan Disember untuk menangani dakwaan pelanggaran hak cipta melalui pembajakan. Tuntutan mahkamah yang difailkan oleh pengarang Andrea Bartz, Charles Graeber, dan Kirk Wallace Johnson pada Ogos 2024, mendakwa bahawa Anthropic memuat turun versi bajakan yang diketahui daripada karya Plaintif. Dokumen mahkamah mendedahkan kebimbangan dalaman daripada pekerja Anthropic mengenai penggunaan buku bajakan untuk tujuan latihan. Hakim Alsup jelas mengenai perkara ini, menyatakan Anthropic tidak mempunyai hak untuk menggunakan salinan bajakan untuk perpustakaan pusatnya.
Garis Masa Undang-undang
- Ogos 2024: Penulis memfailkan tuntutan mahkamah terhadap Anthropic
- Februari 2024: Anthropic mengupah Tom Turvey dari Google Books
- Disember 2025: Tarikh perbicaraan yang dijadualkan untuk tuduhan pembajakan
Syarikat Beralih kepada Strategi Pemerolehan Buku yang Mahal
Dokumen undang-undang mendedahkan bahawa Anthropic membelanjakan berjuta-juta dolar Amerika Syarikat untuk memperoleh dan mendigitalkan buku fizikal untuk latihan AI selepas beralih daripada sumber bajakan. Pada Februari 2024, syarikat mengupah Tom Turvey, yang sebelum ini menguruskan perkongsian untuk Google Books, dengan misi untuk memperoleh semua buku di dunia. Syarikat menggunakan pendekatan pengimbasan yang memusnahkan, membeli buku secara pukal, mengeluarkan penjilidan, mengimbas halaman ke dalam fail PDF yang boleh dibaca mesin, dan kemudian membuang salinan fizikal sepenuhnya.
Impak Kewangan
- Anthropic membelanjakan berjuta-juta USD untuk pemerolehan dan pendigitalan buku
- Syarikat beralih daripada sumber cetak rompak percuma kepada alternatif sah yang mahal
- Proses pengimbasan yang memusnah melibatkan pembelian pukal, pengimbasan, dan pelupusan
Manuver Undang-undang Strategik Meniru Pendekatan Google
Pengambilan Turvey oleh Anthropic nampaknya merupakan percubaan strategik untuk meniru pembelaan undang-undang Google yang berjaya terhadap projek pendigitalan bukunya, yang sebelum ini diputuskan oleh mahkamah sebagai penggunaan adil. Hakim menentukan bahawa kaedah pengimbasan Anthropic merupakan penggunaan adil kerana buku-buku tersebut dibeli secara sah, segera dimusnahkan selepas pengimbasan, dan fail digital digunakan hanya secara dalaman tanpa pengedaran luaran. Pendigitalan penjimatan ruang ini dianggap mempunyai ciri-ciri transformatif yang diperlukan untuk perlindungan penggunaan adil.
Kaedah Alternatif Wujud Tetapi Masih Kurang Digunakan
Kes ini menyerlahkan bahawa teknologi pengimbasan tidak memusnahkan tersedia dengan mudah, seperti yang ditunjukkan oleh organisasi seperti Internet Archive. Awal bulan ini, OpenAI dan Microsoft mengumumkan kerjasama dengan Harvard University Library untuk melatih AI menggunakan hampir satu juta buku domain awam sambil memelihara jilid asal. Walau bagaimanapun, kebanyakan syarikat AI terus mengutamakan kelajuan dan kecekapan kos berbanding pemeliharaan semasa memperoleh data latihan.
Implikasi yang Lebih Luas untuk Industri AI
Keputusan ini datang ketika Rang Undang-undang Data (Use and Access) UK baru-baru ini diluluskan tanpa pindaan yang akan memerlukan syarikat AI mengisytiharkan penggunaan mereka terhadap bahan berhak cipta atau menyediakan peruntukan menarik diri untuk pemegang hak cipta. Preseden undang-undang yang diwujudkan dalam kes ini mungkin mempengaruhi cara syarikat AI mendekati pemerolehan data, mencadangkan bahawa membeli dan mendigitalkan karya berhak cipta mungkin menyediakan laluan yang lebih selamat dari segi undang-undang daripada bergantung pada kandungan dalam talian yang tersedia secara percuma tetapi berpotensi bajakan.