Model Bahasa Fibonacci Novelis Mencetuskan Perdebatan Mengenai Pengecaman Corak Berbanding Pareidolia dalam AI

Pasukan Komuniti BigGo
Model Bahasa Fibonacci Novelis Mencetuskan Perdebatan Mengenai Pengecaman Corak Berbanding Pareidolia dalam AI

Pendekatan eksperimen seorang novelis terhadap pemodelan bahasa menggunakan jujukan Fibonacci telah mencetuskan perbincangan hangat dalam komuniti teknologi mengenai sama ada corak matematik dalam teks mempunyai makna tulen atau mewakili kes melihat corak di mana tiada yang wujud.

Gabriel Smith , bekerja dengan hanya 4MB teks prosa, mencipta apa yang dipanggilnya FMLLM (Fibonacci Language Model) - sistem yang menganalisis perkataan yang muncul pada selang Fibonacci (2, 3, 5, 8, 13, 21 kedudukan jauh) berbanding perkataan bersebelahan seperti model bahasa tradisional. Pendekatan ini berpunca daripada latar belakangnya sebagai novelis, di mana beliau akan menjejaki kedudukan perkataan penting dalam hamparan dan menyedari ia sering membentuk corak lingkaran.

Selang Fibonacci Yang Digunakan: 2, 3, 5, 8, 13, 21, dan sebagainya kedudukan dari kata sasaran

Keraguan Komuniti Terhadap Kesahihan Corak

Komuniti teknologi telah menimbulkan persoalan serius mengenai sama ada kejelasan yang ketara dalam output model datang daripada selang Fibonacci itu sendiri atau daripada proses penapisan yang berat. Pengkritik menunjukkan bahawa sistem menggunakan transformer ayat untuk menapis calon yang dihasilkan secara agresif, berpotensi mencipta ilusi makna melalui pasca-pemprosesan berbanding pendekatan matematik asas.

Satu kritikan yang tajam mencadangkan ini boleh menjadi kes pareidolia bahasa - serupa dengan melihat wajah dalam awan - di mana otak manusia mencipta sambungan bermakna antara perkataan yang dikaitkan secara rawak. Kebimbangan adalah bahawa sebarang kejelasan semantik mungkin terhasil daripada keupayaan padanan corak otak berbanding struktur linguistik tulen.

Penapisan: Menggunakan NLTK untuk kata henti, Spacy untuk penandaan bahagian pertuturan, dan transformator ayat untuk pemeringkatan koheren

Pelaksanaan Teknikal Menimbulkan Persoalan

Model berfungsi dengan membina jadual ramalan dua arah: jika perkataan X muncul pada kedudukan N, perkataan apa yang muncul pada jarak Fibonacci ke hadapan dan ke belakang? Semasa penjanaan, perkataan hanya dipilih jika ia menunjukkan kebarangkalian dalam kedua-dua arah. Walau bagaimanapun, beberapa ahli komuniti telah menyatakan ini kedengaran sangat serupa dengan rantai Markov, teknik penjanaan teks yang telah mantap.

Kekurangan kawalan yang betul telah menarik kritikan ketara. Ahli komuniti meminta perbandingan antara selang Fibonacci dan selang rawak untuk menentukan sama ada jujukan matematik memberikan sebarang kelebihan sebenar berbanding pemilihan peluang.

Kaedah Penjanaan: Pengesahan dua hala yang memerlukan perkataan untuk menunjukkan kebarangkalian dalam kedua-dua arah ke hadapan dan ke belakang

Keputusan Bercampur Mencetuskan Perdebatan Lanjut

Contoh Smith menunjukkan output menarik seperti mengubah televisyen kepada perkataan berkaitan tema termasuk pengeluar, saluran, dan impuls elektromagnet. Untuk input sarah loves my french toast, sistem menghasilkan sarah loves my french toast a piney connubial produit - yang Smith tafsirkan sebagai merujuk kepada sirap maple (piney), cinta (connubial), dan perkataan Perancis untuk produk.

Walau bagaimanapun, pengkritik berhujah tafsiran ini mewakili bias pengesahan berbanding pemahaman AI tulen. Model tanda baca, dilatih pada set data 4MB yang sama, menunjukkan keputusan bercampur - meletakkan beberapa koma dan noktah dengan betul sambil membuat kesilapan jelas dalam yang lain.

Contoh Input/Output: "television" → "television producer widest impunity exposure autobiographical suffering scrutinizing vulgarity worship america..."

Implikasi Lebih Luas untuk Penyelidikan AI

Perdebatan menyerlahkan persoalan asas mengenai pengecaman corak dalam pembangunan AI. Walaupun pendekatan Smith melihat melampaui perkataan bersebelahan mencabar pemikiran konvensional mengenai pemodelan bahasa, komuniti kekal berpecah mengenai sama ada jujukan Fibonacci mewakili kejayaan bermakna atau kes rumit mencari corak dalam bunyi.

Perbincangan telah menarik perbandingan dengan usaha mencari corak lain seperti astrologi dan kod Bible, mencadangkan sesetengah pihak melihat ini sebagai pseudosains berbanding penyelidikan AI yang sah. Yang lain mendapati pendekatan ini cukup menarik untuk menjamin penyiasatan lanjut dengan kawalan saintifik yang betul.

Sehingga Ogos 2025, Smith telah menerbitkan beberapa kod dan menjalankan kajian kecil yang mencadangkan awan perkataan yang dihasilkan Fibonacci mungkin meningkatkan tugas penulisan kreatif apabila dilampirkan pada gesaan. Walau bagaimanapun, saiz sampel kekal terlalu kecil untuk kesimpulan muktamad, meninggalkan komuniti teknologi berpecah antara rasa ingin tahu dan keraguan mengenai pendekatan tidak konvensional ini terhadap pemodelan bahasa.

Rujukan: FMLLM