Komuniti kecerdasan buatan sedang bergelut dengan cabaran asas yang boleh menentukan masa depan pembangunan AI. Walaupun syarikat teknologi utama seperti Google DeepMind, Meta, dan OpenAI berlumba-lumba untuk membina sistem AI dengan model dunia yang canggih - perwakilan dalaman tentang bagaimana dunia berfungsi - bukti semasa menunjukkan sistem ini masih jauh daripada mencapai matlamat tersebut.
![]() |
---|
Penjajaran dunia miniatur di dalam globe salji dengan papan litar menyerlahkan usaha komuniti AI untuk membangunkan model dunia yang tulen di tengah-tengah batasan semasa |
Jurang Antara Jangkaan dan Realiti
Penyelidikan terkini mendedahkan bahawa model bahasa besar hari ini sebenarnya tidak membangunkan model dunia yang koheren seperti yang diharapkan oleh ramai pakar. Sebaliknya, mereka mempelajari apa yang penyelidik panggil sebagai kumpulan heuristik - koleksi peraturan yang tidak bersambung yang boleh mengendalikan senario tertentu tetapi tidak membentuk pemahaman yang bersatu. Penemuan ini mempunyai implikasi yang ketara untuk kebolehpercayaan dan prestasi AI.
Komuniti telah memerhatikan batasan ini secara langsung melalui aplikasi praktikal. Pembangun permainan yang bekerja dengan sistem AI melaporkan bahawa walaupun model yang paling canggih bergelut dengan pengurusan keadaan asas dan konsistensi peraturan. Apabila ditugaskan dengan cabaran mudah seperti menavigasi labirin langkah demi langkah, sistem ini dengan cepat menjadi keliru dan mula membuat pergerakan bulat yang tidak logik.
Heuristik: Peraturan mudah atau jalan pintas yang digunakan untuk menyelesaikan masalah dengan cepat, tetapi tidak sentiasa tepat
Had Semasa Model Dunia AI:
- Model bahasa besar menggunakan "kumpulan heuristik" dan bukannya representasi dunia yang koheren
- Prestasi merosot dengan ketara apabila berlaku perubahan persekitaran yang kecil (1% halangan jalan menyebabkan kegagalan sistem)
- Tidak dapat mengekalkan keadaan dalaman yang konsisten semasa tugasan berurutan
- Bergelut dengan konsistensi peraturan asas dalam senario permainan
Pemeriksaan Realiti Enjin Catur
Komuniti AI permainan menyediakan bukti yang meyakinkan tentang batasan semasa. Enjin catur dan permainan papan tradisional masih mengatasi rangkaian neural dengan melaksanakan peraturan permainan yang jelas dan mencari ke hadapan berbilang langkah. AI moden membantu dengan fungsi penilaian dan pemangkasan langkah, tetapi model dunia teras - memahami peraturan permainan dan langkah yang sah - masih mesti diprogramkan secara manual oleh manusia.
Tiada yang mengalahgi 'melaksanakan logik permainan secara penuh dan dengan pemangkasan pada beberapa heuristik melihat 50 langkah ke hadapan'. Inilah cara enjin catur berfungsi dan bagaimana semua AI permainan berasaskan giliran yang baik berfungsi.
Walaupun sistem canggih seperti AlphaGo dan MuZero, walaupun prestasi mereka yang mengagumkan, memerlukan pelaksanaan peraturan yang diprogramkan manusia sebagai asas mereka. Komponen AI meningkatkan strategi dan penilaian, tetapi tidak dapat menggantikan keperluan untuk pemodelan dunia yang jelas.
Pemangkasan langkah: Teknik untuk menghapuskan langkah yang jelas buruk daripada pertimbangan untuk mempercepatkan pembuatan keputusan
Enjin Permainan Tradisional lwn AI:
- Enjin tradisional: Pelaksanaan peraturan eksplisit + carian pokok + penilaian heuristik
- Sistem AI: Padanan corak tanpa pemahaman peraturan sebenar
- AlphaGo / MuZero : Masih memerlukan asas peraturan yang diprogramkan oleh manusia
- Enjin catur: Melihat ke hadapan 50+ langkah menggunakan model dunia yang dilaksanakan secara manual
Cabaran Teknikal dalam Pelaksanaan
Pembangun yang cuba mencipta sistem AI untuk permainan papan menghadapi corak yang konsisten. Walaupun AI boleh menghasilkan kod bermain permainan apabila diberi maklumat lengkap, ia gagal apabila diperlukan untuk mengekalkan keadaan secara dalaman atau menyesuaikan diri dengan keadaan yang berubah. Kajian navigasi jalan Manhattan yang disebut dalam penyelidikan asal menunjukkan kerapuhan ini - apabila hanya 1% jalan disekat secara rawak, prestasi AI runtuh sepenuhnya.
Komuniti telah bereksperimen dengan pelbagai pendekatan untuk menangani batasan ini. Sesetengah pembangun cuba meminta sistem AI menulis nota terperinci untuk diri mereka sendiri bagi mengekalkan konteks merentas interaksi, tetapi walaupun pendekatan ini mendedahkan jurang asas. Sistem sering terlupa maklumat penting seperti orientasi semasa atau gagal memasukkan arahan penting untuk mentafsir perwakilan keadaan mereka sendiri.
Pendekatan Penyelidikan Yang Sedang Diterokai:
- Data latihan multimodal (video, simulasi 3D, teks)
- Seni bina khusus ( Tolman-Eichenbaum Machine )
- Penyahkodan terkekang tatabahasa untuk output berstruktur
- Percikan Gaussian sebagai perwakilan model dunia
- Seni bina model yang memasang sendiri
Jalan Ke Hadapan
Walaupun batasan semasa, komuniti AI kekal optimis tentang penyelesaian berpotensi. Sesetengah penyelidik sedang meneroka seni bina khusus seperti Tolman-Eichenbaum Machine, yang menunjukkan harapan dalam tugas menyelesaikan labirin dan menghasilkan corak pengaktifan seperti otak. Yang lain sedang menyiasat sama ada jumlah besar data latihan multimodal akhirnya boleh membawa kepada model dunia yang muncul.
Konsensus di kalangan pengamal ialah model dunia sebenar kekal penting untuk mencapai sistem AI yang kukuh. Tanpanya, AI akan terus rapuh dan tidak boleh dipercayai apabila berhadapan dengan situasi baru atau perubahan sedikit kepada persekitaran yang biasa.
Perjalanan ke arah model dunia AI yang tulen mewakili salah satu cabaran paling ketara dalam bidang ini. Walaupun sistem semasa boleh melakukan pencapaian yang mengagumkan melalui pemadanan corak statistik, membina AI yang benar-benar memahami dan memodelkan dunia kekal sebagai masalah yang tidak dapat diselesaikan yang mungkin memerlukan terobosan asas dalam seni bina dan pendekatan latihan.
Rujukan: 'World Models,' an Old Idea in AI, Mount a Comeback