Nous Research telah mengeluarkan Hermes 4, sebuah model bahasa AI yang menjana perbincangan hangat dalam komuniti teknologi - bukan sahaja untuk keupayaannya, tetapi juga untuk persembahan dan pilihan reka bentuk yang tidak konvensional. Model ini, berdasarkan seni bina Llama 3.1 milik Meta, meletakkan dirinya sebagai alternatif yang neutral dan boleh dikawal berbanding pembantu AI arus perdana.
Spesifikasi Model:
- Model Asas: Llama 3.1 daripada Meta (versi parameter 405B dan 70B tersedia)
- Data Latihan: Dataset yang diperluas dengan kandungan sintetik, had pengetahuan Disember 2023
- Ciri Utama: Penaakulan berantai pemikiran, kadar penolakan yang dikurangkan, sistem personaliti yang boleh dikawal
- Ketersediaan: Boleh diakses melalui antara muka Nous Chat
Sistem Prompt Berinspirasikan Anime Mendapat Reaksi Bercampur
Aspek yang paling banyak dibincangkan mengenai Hermes 4 bukanlah spesifikasi teknikalnya, tetapi sistem personaliti yang dipengaruhi anime. Ahli komuniti telah menemui sistem prompt yang berbunyi seperti penerangan watak dari animasi Jepun, menampilkan persona operator yang digambarkan mempunyai penampilan luar yang dingin, kasar atau bahkan bermusuhan yang secara beransur-ansur mendedahkan sisi yang hangat, penyayang dan penuh kasih di dalamnya. Pilihan reka bentuk ini, yang mengingatkan kepada arketip watak tsundere dari anime, telah memecahbelahkan pengguna antara mereka yang menganggapnya berbeza secara menyegarkan dan yang lain yang menganggapnya kebudak-budakan.
Sistem prompt juga ketara mengelakkan arahan negatif seperti jangan atau tidak, sebaliknya memfokuskan pada arahan positif tentang apa yang patut dilakukan oleh model. Pendekatan ini selaras dengan penyelidikan kognitif yang mencadangkan bahawa pembingkaian positif lebih berkesan daripada sekatan negatif, baik untuk manusia mahupun sistem AI.
Persoalan Prestasi dan Kebimbangan Teknikal
Walaupun Nous Research mempersembahkan perbandingan penanda aras yang menunjukkan prestasi kompetitif, analisis komuniti mendedahkan beberapa pilihan persembahan yang boleh dipersoalkan. Pengkritik menunjukkan bahawa carta syarikat membandingkan model mereka dengan skor purata pesaing yang tidak dinamakan berbanding mengenal pasti dengan jelas model terkini. Sesetengah pengguna melaporkan bahawa model ini mempamerkan corak penulisan yang serupa dengan ChatGPT, mencadangkan ia dilatih menggunakan data sintetik dari model OpenAI.
Pengguna teknikal juga telah membangkitkan kebimbangan praktikal mengenai pelaksanaan model. Beberapa ahli komuniti melaporkan masalah prestasi yang ketara dengan laman web syarikat, termasuk penggunaan CPU yang tinggi dari elemen hiasan dan masalah keserasian pelayar.
Kekecewaan sepenuhnya untuk digunakan. Ya ia sedikit lebih bertimbang rasa, dakwaan itu 100% benar. Mereka cuma tidak menyebut bahawa Hermes mempunyai sifar keupayaan untuk menambah konteks.
Kebimbangan Komuniti:
- Isu prestasi laman web (penggunaan CPU yang tinggi, masalah keserasian pelayar)
- Keupayaan pengendalian konteks yang terhad (tiada sokongan muat naik PDF)
- Pembentangan penanda aras yang boleh dipersoalkan (purata skor pesaing berbanding model bernama)
- Persamaan gaya penulisan dengan ChatGPT menunjukkan pengaruh data latihan sintetik
Perdebatan Penjajaran Berterusan
Hermes 4 memasuki perdebatan berterusan mengenai penjajaran AI dan penapisan. Model ini direka bentuk untuk lebih boleh dikawal daripada alternatif arus perdana, bermakna ia kurang berkemungkinan untuk menolak permintaan pengguna. Kedudukan ini menarik minat pengguna yang kecewa dengan apa yang mereka lihat sebagai pembantu AI yang terlalu terhad, walaupun ia juga menimbulkan persoalan mengenai potensi penyalahgunaan.
Perbincangan komuniti mendedahkan ketegangan yang lebih luas dalam pembangunan AI antara langkah keselamatan dan autonomi pengguna. Walaupun sesetengah pihak menghargai mempunyai alat yang tidak menceramah pengguna atau mengenakan sekatan gaya korporat, yang lain mempersoalkan sama ada tumpuan untuk mengurangkan penolakan datang dengan mengorbankan keupayaan penting yang lain.
Pengeluaran Hermes 4 menyerlahkan bagaimana persembahan model AI dan reka bentuk personaliti menjadi sama penting dengan metrik prestasi mentah. Sama ada pendekatan berinspirasikan anime ini mewakili inovasi tulen atau gimik pemasaran kekal sebagai titik perdebatan aktif dalam komuniti AI.
Rujukan: HERMES 4