Keluaran terbaru GPT-5 daripada OpenAI telah mencetuskan perbincangan meluas dalam kalangan pengguna yang melaporkan pengalaman bercampur-campur dengan model baharu ini. Walaupun syarikat itu meletakkan GPT-5 sebagai kemajuan yang ketara, ramai pengguna mendapati diri mereka kecewa dengan pelbagai aspek prestasi dan fungsinya.
Kebimbangan Kualiti dan Isu Penghalaan Model
Pengguna telah melaporkan perbezaan kualiti yang ketara antara GPT-5 dan model-model pendahulunya. Ramai mendapati bahawa GPT-5 menghasilkan lebih sedikit pusingan pemikiran berbanding model O3 sebelum ini dan tidak menggunakan carian web dengan berkesan. GPT tersuai, yang banyak pengguna bergantung padanya untuk tugas-tugas khusus, nampaknya rosak dan mengabaikan arahan tanpa mengira model yang dipilih. Fungsi penyelidikan mendalam, ciri utama bagi ramai pengguna profesional, kelihatan tidak berfungsi walaupun dipilih secara eksplisit.
Sistem penghalaan model, yang direka untuk memilih model terbaik secara automatik bagi setiap tugas, telah menjadi punca kekecewaan. Pengguna melaporkan bahawa keputusan penghalaan tidak telus, dan mereka tidak dapat mengawal dengan mudah model khusus mana yang mengendalikan permintaan mereka. Ini telah menyebabkan keputusan yang tidak dapat diramal dan mengurangkan keyakinan pengguna terhadap sistem.
Isu Teknikal yang Dilaporkan:
- GPT tersuai mengabaikan arahan tanpa mengira model yang dipilih
- Ciri penyelidikan mendalam kelihatan tidak berfungsi
- Proses pembersihan konteks menyebabkan kehilangan rangkaian perbualan
- Masalah halusinasi berterusan dalam domain khusus
- Penaakulan spatial dan pemprosesan imej kekal bermasalah
- Penghalaan model tidak mempunyai ketelusan dan kawalan pengguna
Masalah Konteks dan Pengurusan Perbualan
Isu penting yang menjejaskan pengalaman pengguna ialah kesukaran GPT-5 yang ketara dalam mengekalkan konteks perbualan. Pengguna menggambarkan situasi di mana model kehilangan benang perbualan secara tiba-tiba, memerlukan gesaan seperti Sila semak perbualan terkini sebelum meneruskan untuk kembali ke landasan yang betul. Respons juga menjadi lebih ringkas secara ketara, mewujudkan pengalaman yang mengejutkan yang terasa seperti bercakap dengan seseorang yang tidak mendengar.
Masalah pengurusan konteks ini nampaknya berpunca daripada proses pembersihan konteks yang agresif yang mungkin merumuskan sorotan perbualan dengan buruk, secara berkesan memberikan model ingatan kerja yang lebih kecil daripada yang dijangkakan.
Pertukaran Prestasi vs Kos
Keluaran ini nampaknya sebahagian daripada strategi OpenAI untuk menguruskan kos sambil meningkatkan skala kepada pangkalan pengguna yang lebih besar. Pemerhati industri menyatakan bahawa menjalankan model-model ini pada prestasi maksimum boleh menelan kos beribu-ribu dolar Amerika Syarikat setiap pengguna setiap bulan. Reka bentuk GPT-5 kelihatan dioptimumkan untuk penggunaan secara besar-besaran dan bukannya prestasi puncak, yang menjelaskan mengapa pengguna berkuasa yang sudah biasa dengan keupayaan O3 berasa kecewa.
Menariknya, GPT-5 Pro , versi premium, menunjukkan prestasi yang lebih baik dalam tugas-tugas pengekodan dan dapat menyelesaikan masalah kompleks yang menyukarkan model-model sebelumnya. Walau bagaimanapun, ia datang dengan kos yang lebih tinggi dan had kadar yang menjadikannya kurang mudah diakses untuk penggunaan biasa.
Perbandingan GPT-5 dengan Model Terdahulu:
- Pengurusan Konteks: GPT-5 menunjukkan keupayaan yang berkurangan untuk mengekalkan aliran perbualan berbanding O3
- Carian Web: Integrasi carian web yang kurang berkesan daripada model O3 terdahulu
- Custom GPTs: Fungsi yang rosak, mengabaikan arahan pengguna
- Penyelidikan Mendalam: Tidak berfungsi walaupun dipilih secara eksplisit
- Gaya Respons: Respons yang lebih ringkas, pengurangan pusingan pemikiran
- Kos: Direka untuk penggunaan secara besar-besaran dan bukannya prestasi puncak
Had Teknikal Berterusan
Walaupun keluaran baharu, isu asas yang telah menyusahkan model bahasa besar terus menjejaskan GPT-5 . Model ini masih bergelut dengan mengatakan Saya tidak tahu apabila ia kekurangan maklumat, sebaliknya menghasilkan respons yang kedengaran yakin tetapi tidak betul. Masalah halusinasi ini terutamanya menjejaskan domain khusus di mana pengguna memerlukan maklumat yang boleh dipercayai dan tepat.
Keupayaan penaakulan spatial dan pemprosesan imej model kekal bermasalah, dengan pengguna melaporkan bahawa ia gagal dalam tugas visual asas dan menghasilkan respons yang tidak masuk akal apabila bekerja dengan imej.
Penyesuaian Pengguna dan Jangkaan
Respons komuniti menyerlahkan cabaran yang lebih luas dalam pembangunan AI: menguruskan jangkaan pengguna berbanding realiti teknikal. Walaupun GPT-5 mewakili peningkatan berperingkat dalam beberapa bidang, ia gagal memenuhi kemajuan revolusioner yang dijangkakan oleh ramai pengguna. Sesetengah pengguna telah menyesuaikan diri dengan menggunakan pelbagai model AI untuk tugas yang berbeza, menganggap setiap satu sebagai alat khusus dan bukannya penyelesaian tujuan umum.
Sambutan bercampur-campur terhadap GPT-5 mencerminkan keadaan semasa pembangunan AI, di mana kemajuan datang dalam langkah-langkah yang lebih kecil dan bukannya lonjakan dramatik. Pengguna sedang belajar menavigasi kekuatan dan kelemahan model yang berbeza, sering mengekalkan langganan kepada pelbagai perkhidmatan untuk mengakses alat terbaik bagi setiap tugas khusus.
Rujukan: GPT-5: Overdan, overhyped and underwhelming. And that's not the worst of it.