Model AI Kecil Samsung 7M-Parameter Mengatasi Gergasi Seperti Gemini dan o3-mini

Pasukan Editorial BigGo
Model AI Kecil Samsung 7M-Parameter Mengatasi Gergasi Seperti Gemini dan o3-mini

Dalam industri yang obses dengan penskalaan model yang semakin besar, pasukan penyelidikan AI Samsung telah mengambil pendekatan yang berbeza secara radikal yang mencabar andaian asas tentang kecerdasan buatan. Model Rekursif Kecil (TRM) terobosan mereka, dengan hanya tujuh juta parameter, mencapai keupayaan penaakulan yang setanding atau melebihi model beribu-ribu kali lebih besar, berpotensi membentuk semula cara kita berfikir tentang kecekapan dan prestasi AI.

Model Rekursif Kecil (TRM) yang inovatif mempamerkan pendekatan Samsung yang inovatif terhadap AI, menekankan kecekapan dan keupayaan penaakulan yang canggih
Model Rekursif Kecil (TRM) yang inovatif mempamerkan pendekatan Samsung yang inovatif terhadap AI, menekankan kecekapan dan keupayaan penaakulan yang canggih

Revolusi Rekursif dalam Seni Bina AI

Inovasi teras di sebalik TRM Samsung terletak pada falsafah reka bentuk rekursifnya, yang membayangkan semula secara asas bagaimana model AI memproses maklumat. Daripada membina rangkaian yang lebih dalam dengan lebih banyak lapisan, para penyelidik mencipta sistem yang memperhalusi outputnya sendiri melalui pelbagai laluan berulang. Pendekatan ini meniru penyelesaian masalah manusia di mana kita terus menambah baik jawapan kita melalui renungan dan semakan. Model ini menggunakan apa yang para penyelidik panggil sebagai penapisan rekursif keadaan pendam dan output tanpa mengandaikan penumpuan, bermakna ia tidak terlalu cepat berpuas hati dengan jawapan tetapi terus meningkatkannya melalui pemprosesan berulang.

Ciri-ciri Seni Bina Utama:

  • Model tunggal 2-lapisan dengan pemprosesan rekursif
  • Mekanisme pemberhentian adaptif untuk menentukan titik berhenti yang optimum
  • Penyeliaan mendalam dengan maklum balas pada pelbagai peringkat pemprosesan
  • Penambahbaikan output melalui kitaran penaakulan berulang

Prestasi Mengagumkan Berbanding Pencapaian Industri

Model kecil Samsung telah menunjukkan keupayaan luar biasa merentasi pelbagai tugas penaakulan yang mencabar. Pada teka-teki Sudoku-Extreme, TRM mencapai ketepatan 87.4%, dengan ketara mengatasi ketepatan 55% Model Penaakulan Berhirarki. Sistem ini juga menunjukkan ketepatan 85% pada teka-teki Maze-Hard yang kompleks dan mencapai ketepatan 45% pada penanda aras ARC-AGI-1 yang menuntut, yang menguji keupayaan penaakulan abstrak sering dikaitkan dengan kecerdasan buatan umum. Yang paling ketara, keputusan ini sama ada menyamai atau melebihi prestasi model besar seperti Google Gemini 2.5 Pro, OpenAI o3-mini, dan DeepSeek R1, walaupun menggunakan hanya sebahagian kecil sumber pengiraan mereka.

Penanda Aras Prestasi TRM:

  • Sudoku-Extreme: 87.4% ketepatan
  • Teka-teki Maze-Hard: 85% ketepatan
  • ARC-AGI-1: 45% ketepatan
  • ARC-AGI-2: 8% ketepatan

Kelebihan Kecekapan dalam Aplikasi Praktikal

Implikasi terobosan kecekapan ini melangkaui rasa ingin tahu akademik. Menjalankan model trilion-parameter memerlukan kelompok besar cip khusus dan belanjawan tenaga yang hanya mampu ditanggung oleh syarikat teknologi terbesar. Sebaliknya, footprint tujuh-juta-parameter TRM boleh beroperasi pada perkakasan komoditi dengan penggunaan tenaga yang jauh lebih rendah. Ini membuka pembangunan AI kepada startup, universiti, dan projek pengkomputeran tepi yang sebelum ini tidak boleh menyertai penyelidikan AI terkini disebabkan kekangan sumber. Saiz kecil model juga membolehkan penempatan tempatan, menangani kebimbangan privasi berkaitan dengan perkhidmatan AI berasaskan awan.

Perbandingan Saiz Model:

  • Samsung TRM: 7 juta parameter
  • Model bahasa besar biasa: Berbilion parameter
  • Perbandingan prestasi: TRM setanding atau mengatasi model seperti Gemini 2.5 Pro, o3-mini, dan DeepSeek R1

Peralihan Industri ke Arah Pembangunan AI Mampan

Pencapaian Samsung tiba pada detik kritikal apabila industri AI menghadapi pemerhatian semakin meningkat mengenai kesan alam sekitar dan kos operasi. Walaupun syarikat seperti Meta dan Google terus mengejar model besar, mereka secara serentak melabur dalam teknik seperti pemangkasan dan kuantisasi untuk mengurangkan permintaan pengiraan. Fokus Apple pada kecerdasan dalam peranti mengikut prinsip kecekapan yang sama. Pendekatan TRM mencadangkan bahawa inovasi seni bina, bukannya mampatan semata-mata model sedia ada, mungkin menawarkan lompatan besar seterusnya dalam kecekapan AI. Seperti yang dihujahkan oleh pasukan saintis penyelidikan Alexia Jolicoeur-Martineau, bidang ini semakin tersilap menganggap isipadu sebagai kecerdasan, dan kerja mereka menunjukkan bahawa reka bentuk yang lebih bijak boleh menggantikan penskalaan daya kasar.

Aplikasi Masa Depan dan Arah Penyelidikan

Walaupun TRM kini cemerlang dalam tugas penaakulan berstruktur seperti teka-teki logik dan pencarian laluan, aplikasi potensinya merangkumi banyak domain. Perusahaan boleh mengedarkan model mikro khusus untuk tugas penaakulan tertentu sambil menyimpan model bahasa besar untuk penjanaan teks, mencipta sistem hibrid yang mengoptimumkan kedua-dua prestasi dan kos. Pendekatan rekursif juga mungkin melengkapkan sistem AI sedia ada sebagai sub-modul khusus untuk penaakulan matematik atau logik. Samsung telah membuat kedua-dua kod dan butiran latihan tersedia secara terbuka di GitHub, menggalakkan penerimaan dan penyesuaian lebih luas oleh komuniti penyelidikan. Apabila industri AI bergelut dengan cabaran kemampanan, TRM mewakili laluan alternatif yang menarik ke hadapan—satu di mana kecerdasan muncul bukan dari skala, tetapi dari reka bentuk seni bina yang canggih.