Kemenangan mahkamah terbaru Anthropic telah mendedahkan pendekatan luar biasa untuk latihan AI yang memecahbelahkan komuniti teknologi. Syarikat itu secara fizikal memusnahkan berjuta-juta buku untuk mencipta data latihan digital bagi Claude , pesaing ChatGPT mereka, dengan membelanjakan berjuta-juta dolar Amerika dalam proses tersebut. Walaupun sah dari segi undang-undang, kaedah ini telah mencetuskan perdebatan sengit mengenai tanggungjawab alam sekitar dan etika pembangunan AI.
Penyelesaian Undang-undang Mencipta Akibat Tidak Dijangka
Pemusnahan tersebut bukanlah vandalisme rawak tetapi strategi undang-undang yang dikira. Undang-undang hak cipta mewujudkan situasi pelik di mana membeli buku fizikal menawarkan lebih kebebasan daripada melesenkan versi digital. E-book datang dengan terma pelesenan yang ketat dan perlindungan DRM yang menjadikan pemprosesan pukal berisiko dari segi undang-undang. Buku fizikal, yang dilindungi oleh doktrin jualan pertama, boleh diubah suai atau dimusnahkan setelah dibeli.
Realiti undang-undang ini memaksa Anthropic menggunakan pendekatan yang boleh dipersoalkan dari segi alam sekitar. Mereka mengupah Tom Turvey , bekas pekerja Google Books , untuk melaksanakan operasi pengimbasan besar-besaran yang melibatkan pemotongan jilidanbuku, pengimbasan halaman, dan pembuangan sisa kertas. Proses ini dianggap sebagai penggunaan adil oleh Hakim William Alsup , tetapi hanya kerana Anthropic membeli buku tersebut secara sah dan menyimpan fail digital secara dalaman.
Perbandingan Rangka Kerja Undang-undang
Kaedah | Status Undang-undang | Cabaran |
---|---|---|
Pengimbasan Buku Fizikal | Sah di bawah doktrin jualan pertama | Mahal, pembaziran alam sekitar |
Pelesenan E-book | Memerlukan perjanjian penerbit | Sekatan DRM, ketersediaan terhad |
Kandungan Cetak Rompak | Pelanggaran hak cipta | Liabiliti undang-undang, potensi tuntutan mahkamah |
Komuniti Berpecah Mengenai Kesan Alam Sekitar
Reaksi komuniti teknologi mendedahkan kebimbangan mendalam mengenai amalan alam sekitar syarikat AI. Ramai yang melihat pemusnahan buku sebagai pembaziran, terutamanya apabila perubahan iklim menuntut penggunaan sumber yang lebih bertanggungjawab. Pengkritik berhujah bahawa kaedah alternatif wujud - The Internet Archive telah mempelopori teknik pengimbasan tanpa pemusnahan yang memelihara buku fizikal sambil mencipta salinan digital.
Walau bagaimanapun, yang lain mempertahankan amalan tersebut sebagai kitar semula pragmatik. Kebanyakan buku yang dimusnahkan adalah jilid biasa yang dibeli secara pukal daripada peruncit utama, bukan manuskrip nadir. Seperti yang dinyatakan oleh seorang pemerhati, sedikit orang di bawah umur 30 tahun mengekalkan perpustakaan peribadi lagi, menunjukkan buku-buku ini mungkin akan berakhir sebagai sisa juga.
Pendekatan Alternatif
- Internet Archive: Pengimbasan tanpa kemusnahan mengekalkan buku fizikal
- Perkongsian Harvard: OpenAI / Microsoft bekerjasama dengan perpustakaan mengenai buku domain awam
- Google Books: Mewujudkan preseden undang-undang untuk projek pendigitalan buku
- The Pile: Meta menggunakan set data ini tanpa memusnahkan buku fizikal
![]() |
---|
Dikelilingi oleh kertas yang dicincang, adegan lucu ini mencerminkan kritikan terhadap pembaziran dalam amalan latihan AI |
Fiksyen Sains Menjadi Realiti
Situasi ini secara menakutkan mencerminkan novel Vernor Vinge tahun 2006, Rainbow's End , yang menggambarkan dunia 2025 di mana perpustakaan menggunakan mesin gergasi untuk mencincang buku sambil memfoto serpihan untuk pembinaan semula digital. Beberapa ahli komuniti menyatakan persamaan ini, menyerlahkan bagaimana pembangunan AI semasa menyerupai fiksyen distopia.
Ironinya tidak hilang pada pemerhati bahawa sementara Harvard dengan teliti memelihara manuskrip berusia 600 tahun untuk latihan AI, berjuta-juta buku moden telah dikurangkan kepada bahan kitar semula untuk mengajar Claude mengenai kesusasteraan dan penulisan.
Implikasi Lebih Luas untuk Industri AI
Kes ini mendedahkan kelaparan terdesak industri AI untuk data latihan berkualiti tinggi dan halangan undang-undang yang mereka hadapi. Syarikat pada mulanya beralih kepada kandungan cetak rompak untuk mengelakkan kerumitan undang-undang/amalan/perniagaan - rundingan pelesenan yang kompleks dengan penerbit. Apabila tekanan undang-undang meningkat, mereka mencari alternatif yang lebih selamat, walaupun mahal dari segi alam sekitar.
Situasi ini mendedahkan masalah asas: undang-undang hak cipta semasa menjadikan pemusnahan fizikal lebih menarik dari segi undang-undang daripada pelesenan digital. Ini mewujudkan insentif songsang di mana syarikat memilih kaedah pembaziran berbanding yang cekap semata-mata untuk perlindungan undang-undang.
Perdebatan ini akhirnya mencerminkan persoalan yang lebih besar mengenai keutamaan pembangunan AI. Walaupun teknologi ini menjanjikan faedah yang ketara, kaedah yang digunakan untuk menciptanya menimbulkan persoalan serius mengenai tanggungjawab alam sekitar dan pengurusan sumber dalam era krisis iklim.
Rujukan: Anthropic destroyed millions of print books to build its AI models