Revolusi Penaakulan AI: Terobosan Sebenar atau Hanya Kejuruteraan Lebih Baik?

Pasukan Komuniti BigGo
Revolusi Penaakulan AI: Terobosan Sebenar atau Hanya Kejuruteraan Lebih Baik?

Dunia teknologi bersorak apabila OpenAI melancarkan model penaakulannya o1 pada tahun 2024, mengisytiharkannya sebagai satu terobosan dalam kecerdasan buatan. Model-model ini menjanjikan pemikiran langkah demi langkah, penyelesaian masalah kompleks, dan kemampuan mengendalikan matematik peringkat siswazah. Walau bagaimanapun, pemeriksaan lebih dekat tentang bagaimana sistem ini sebenarnya berfungsi telah mencetuskan perdebatan sengit dalam kalangan pemaju dan penyelidik tentang sama ada kita menyaksikan kemajuan AI yang sebenar atau hanya penyelesaian kejuruteraan yang lebih canggih.

Kontroversi Penggunaan Alat

Persoalan asas di tengah-tengah perdebatan ini ialah: apabila model AI menggunakan alat luaran untuk menyelesaikan masalah, adakah ini mewakili penaakulan sebenar atau sekadar orkestrasi yang bijak? Pengkritik menunjuk kepada contoh di mana model seperti o1 menjana kod Python untuk melakukan pengiraan aritmetik dan bukannya mengira jawapan secara dalaman. Ini menyebabkan sesetengah pemerhati mempersoalkan sama ada kecerdasan teras model ini sebenarnya telah bertambah baik, atau jika pemaju hanya membina sistem perpaipan yang lebih baik di sekitar asas yang pada dasarnya stagnan.

Walau bagaimanapun, pakar teknikal dengan pantas mencabar pencirian ini. Melalui ujian API langsung, pemaju menunjukkan bahawa model penaakulan sememangnya boleh melakukan pengiraan kompleks seperti mendarab nombor besar melalui proses penaakulan dalaman tulen, tanpa menggunakan alat luaran. Model-model ini menunjukkan kerja mereka melalui jejak penaakulan terperinci langkah demi langkah yang menyerupai pendekatan penyelesaian masalah manusia.

Keupayaan untuk merantaikan panggilan alat dengan cara ini itu sendiri merupakan peningkatan model yang mendalam yang berlaku, dalam model asas arus perdana awam, hanya setahun yang lalu.

Keupayaan ini mewakili kemajuan signifikan dalam metakognisi AI - keupayaan model untuk memutuskan bila untuk menyelesaikan masalah secara dalaman berbanding bila untuk memanfaatkan alat luaran, sama seperti manusia memilih antara kiraan mental dan penggunaan kalkulator bergantung pada kerumitan pengiraan.

Mengukur Kemajuan Sebenar

Perbincangan ini mendedahkan persoalan lebih mendalam tentang bagaimana kita harus mengukur kemajuan AI. Walaupun sesetengah berhujah bahawa keupayaan asas model telah mencapai tahap dataran, pemaju yang berpengalaman melaporkan peningkatan ketara dalam keupayaan pengekodan antara generasi model. Peralihan dari GPT-4 ke GPT-5 membawa kemajuan ketara dalam kualiti penjanaan kod, dengan ramai pemaju beralih dari Claude kembali ke model OpenAI untuk tugas pengaturcaraan.

Penunjuk ekonomi juga mencadangkan pertumbuhan kukuh dalam sektor pengekodan AI. Alat seperti Cursor telah mencapai pendapatan berulang tahunan 500 juta dolar Amerika dalam tempoh 15 bulan, manakala GitHub Copilot melayani berjuta-juta pengguna dan menjana pendapatan beratus-ratus juta. Pengembangan pasaran ini mencadangkan bahawa keupayaan AI semasa, walaupun tanpa penambahbaikan lanjut, boleh mendorong peningkatan produktiviti yang ketara merentas industri perisian untuk masa hadapan yang boleh dijangka.

Pertumbuhan Pasaran Alat Pengekodan AI (setakat Oktober 2025):

  • Cursor: $500J USD ARR dalam 15 bulan, penilaian $10B USD
  • GitHub Copilot: Berjuta-juta pengguna, ratusan juta hasil pendapatan
  • Windsurf: Diambil alih pada harga $2.4B USD
  • Berpuluh-puluh syarikat permulaan mengumpul pusingan pembiayaan sembilan angka

Batasan Seni Bina dan Arah Masa Depan

Di bawah permukaan perdebatan ini terletak satu cabaran seni bina yang lebih asas. Model berasaskan transformer semasa menghadapi batasan yang wujud disebabkan proses penandaan dan penyematan saiz tetap mereka. Sesetengah penyelidik menggambarkan AI moden sebagai melakukan mampatan berkurangan maklumat terhadap internet, di mana makna semantik boleh menjadi terpecah semasa pemprosesan.

Komuniti sedang meneroka beberapa inovasi seni bina yang menjanjikan untuk menangani batasan ini. Seni bina berasaskan graf yang memelihara hubungan struktur boleh menghalang perpecahan semantik yang membelenggu model semasa. Mekanisme perhatian jarang mungkin mengekalkan konteks yang lebih panjang dengan lebih cekap, manakala pendekatan neuromorfik boleh mengambil inspirasi daripada organisasi neural biologi. Walau bagaimanapun, kebanyakan pakar memberi amaran bahawa alternatif ini buat masa ini hanya menawarkan penambahbaikan beransur-ansur dan bukannya terobosan revolusioner.

Jalan Ke Hadapan

Industri AI berada di persimpangan jalan antara dua laluan pembangunan yang berpotensi. Yang pertama melibatkan terus mengoptimumkan seni bina semasa dengan orkestrasi alat yang lebih baik dan integrasi aplikasi yang lebih mendalam - apa yang pengkritik panggil sebagai sistem perpaipan yang lebih baik. Pendekatan ini menawarkan pendapatan jangka pendek yang boleh diramal dan penambahbaikan beransur-ansur yang berterusan.

Laluan alternatif memerlukan pengakuan terhadap batasan seni bina dan pelaburan dalam asas yang berbeza secara asasnya. Ini bermaksud tahun-tahun penyelidikan yang mahal dan tidak pasti dengan tiada jaminan kejayaan, tetapi ia adalah satu-satunya pendekatan yang menangani punca akar dan bukannya gejala. Keputusan antara laluan ini akan menentukan sama ada kesan KDNK 3 trilion dolar Amerika yang diunjurkan daripada AI menjadi realiti atau kekal fantasi.

Semasa perdebatan berterusan, satu perkara kekal jelas: perbincangan teguh komuniti AI mengenai persoalan asas ini mencerminkan bidang yang matang melepasi gembar-gembur dan bergelut dengan cabaran teknikal sukar yang diperlukan untuk kemajuan sebenar. Sama ada melalui penambahbaikan evolusi kepada seni bina semasa atau pendekatan baru yang revolusioner, usaha untuk keupayaan penaakulan sebenar dalam kecerdasan buatan terus berlanjutan.

Rujukan: Reasoning Is Not Model Improvement