Eksperimen seorang pembangun untuk mencipta Wikipedia dijana AI tanpa had telah menghadapi halangan yang tidak dijangka. Projek tersebut, dipanggil EndlessWiki , terpaksa melumpuhkan sementara penjanaan halaman baharu selepas trafik automatik mengumpul kos inferens sebanyak 70 dolar AS dalam satu malam.
Pencipta membina EndlessWiki sebagai cara interaktif untuk meneroka pengetahuan yang terkandung dalam model bahasa besar. Tidak seperti Wikipedia tradisional, setiap halaman di laman web ini dijana atas permintaan oleh AI apabila pengguna mengklik pautan. Konsep ini mengambil inspirasi daripada Library of Babel karya Jorge Luis Borges - idea bahawa model bahasa mengandungi pelbagai teks yang mungkin menunggu untuk ditemui.
Impak Kos:
- Kos Scraping Semalaman: $70 USD
- Jenis Trafik: Bot automatik yang mengklik pautan
- Model Kos Asal: Akses percuma, tidak memerlukan log masuk
- Status Semasa: Diaktifkan semula dengan pengehadan kadar
Realiti Mahal Perkhidmatan AI Awam
Apa yang bermula sebagai eksperimen tidak bersalah dengan cepat menjadi pengajaran mahal tentang realiti internet. Pembangun pada mulanya tidak bimbang tentang kos, dengan mengandaikan klik pautan manual akan mengekalkan penggunaan yang munasabah. Walau bagaimanapun, bot automatik mula mengikis laman web semalaman, menjana halaman demi halaman dan mendorong kos inferens meningkat.
Respons komuniti menyerlahkan isu yang lebih luas dengan perkhidmatan web awam. Ramai pembangun menunjukkan bahawa trafik bot hanyalah fakta kehidupan untuk mana-mana laman web awam. Enjin carian, pengikis, dan pelbagai alat automatik sentiasa merangkak web, sering tanpa mengambil kira kos pengiraan yang mereka kenakan kepada pengendali laman web.
Satu pemerhatian yang sangat bermakna daripada komuniti mencatatkan ironi situasi tersebut:
Ia adalah pengakhiran yang puitis, memandangkan aktiviti pengikisan yang sama tanpa mengambil kira kos kepada pengendali laman web adalah cara model-model ini dilatih pada mulanya.
Cabaran Teknikal dan Langkah Anti-Penipuan
Selain kebimbangan kos, projek ini menghadapi cabaran teknikal yang menarik. Pembangun melaksanakan sistem anti-penipuan untuk menghalang pengguna daripada menavigasi secara manual ke halaman tertentu melalui manipulasi URL. Setiap pautan termasuk parameter asal yang disahkan di bahagian pelayan untuk memastikan pengguna benar-benar mengikuti struktur pautan yang dijana AI.
Seni bina itu sendiri kekal agak mudah: pangkalan data MySQL yang menyimpan halaman yang dijana dan pelayan Golang yang sama ada menyajikan kandungan sedia ada atau menjana halaman baharu menggunakan model Kimi K2 melalui perkhidmatan inferens Groq . Pilihan model yang lebih besar adalah disengajakan, kerana model yang lebih besar biasanya mengandungi lebih banyak pengetahuan fakta yang sesuai untuk kandungan gaya ensiklopedia.
Seni Bina Teknikal:
- Backend: Pelayan Golang dengan pangkalan data MySQL
- Model AI: Pada asalnya Kimi K2 , kemudiannya bertukar kepada GPT-OSS-120B
- Penyedia Inferens: Groq (dipilih kerana kelajuan dan kebolehpercayaan)
- Masa Respons: Beberapa ratus milisaat untuk penjanaan halaman
- Anti-penipuan: Sistem pengesahan slug asal
Keraguan Komuniti dan Kebimbangan Halusinasi
Respons komuniti mendedahkan perasaan bercampur baur tentang kandungan ensiklopedia yang dijana AI. Sesetengah pengguna menyatakan kebimbangan tentang potensi maklumat berhalusinasi, menggambarkannya sebagai lereng licin kepada neraka berhalusinasi. Yang lain mempersoalkan sama ada menghapuskan kawalan editorial manusia - yang dilihat ramai sebagai kekuatan Wikipedia - menjejaskan keseluruhan konsep.
Walaupun terdapat kebimbangan ini, sesetengah ahli komuniti melihat potensi dalam pendekatan tersebut. Mereka mencadangkan bahawa dengan pemeriksaan fakta dan pengesahan sitiran yang betul, wiki yang dijana AI berpotensi meliputi lebih banyak topik daripada versi yang diedit manusia, mungkin menjadi 1000 kali lebih besar daripada Wikipedia semasa.
Masa Depan Penerokaan Pengetahuan Berkuasa AI
Pembangun sejak itu telah mengaktifkan semula perkhidmatan dengan pengehadan kadar dan bertukar kepada model yang berbeza ( GPT-OSS-120B ) untuk menguruskan kos. Insiden ini menyerlahkan cabaran berterusan untuk menjadikan perkhidmatan AI boleh diakses secara awam sambil menguruskan perbelanjaan operasi.
Projek ini mewakili sebahagian daripada trend yang lebih luas ke arah antara muka bukan sembang untuk model bahasa. Daripada interaksi soal jawab tradisional, EndlessWiki menawarkan pendekatan yang lebih penerokaan kepada penemuan pengetahuan AI, serupa dengan cara orang secara semula jadi melayari Wikipedia dengan mengikuti pautan yang menarik.
Walaupun masa depan segera EndlessWiki kekal tidak pasti disebabkan tekanan kos, eksperimen ini telah memberikan wawasan berharga tentang potensi dan perangkap mendemokrasikan penjanaan pengetahuan berkuasa AI.
Rujukan: Endless Al-generated Wikipedia