Keluaran terbaru GPT-5 oleh OpenAI telah mencetuskan perdebatan sengit dalam komuniti AI mengenai sama ada pembangunan kecerdasan buatan telah mencapai tahap mendatar. Walaupun syarikat itu mempamerkan evolusi daripada respons tidak koheren GPT-1 kepada penaakulan canggih GPT-5 , ramai pengguna mempersoalkan sama ada model terkini ini mewakili kemajuan tulen atau langkah ke belakang.
Garis Masa Evolusi Model:
- 2018 GPT-1: Respons tidak koheren, data latihan berat sastera
- 2019 GPT-2: Keupayaan perbualan asas, masih tidak fokus
- 2021 text-davinci-001: Respons langsung dan padat
- 2023 GPT-4-0314: Nada berstruktur dan profesional dengan penafian
- 2025 GPT-5: Respons bertele-tele dan sarat pujian dengan isu teknikal
Kebimbangan Prestasi Mengatasi Dakwaan Pemasaran
Pengguna melaporkan isu-isu ketara dengan fungsi teras GPT-5 . Ramai menggambarkan model ini sebagai keliru dan terdedah kepada ralat yang tidak wujud dalam GPT-4 . Penjanaan kod telah menjadi bermasalah terutamanya, dengan AI salah mentafsir sintaks pengaturcaraan biasa dan gagal menyelesaikan tugasan yang lebih panjang. Seorang pengguna menyatakan bahawa apabila bekerja dengan dokumen markdown bersaiz sederhana (sekitar 700 baris), GPT-5 akan berhenti di tengah ayat, tidak dapat menyelesaikan tugasan.
Model ini juga bergelut dengan ungkapan biasa, mengisinya dengan token karut yang kemudiannya diakui sebagai ralat pemaparan. Kelemahan teknikal ini telah menyebabkan sesetengah pihak mengesyaki bahawa GPT-5 mungkin dioptimumkan lebih untuk mengurangkan kos pengkomputeran OpenAI daripada meningkatkan pengalaman pengguna.
Isu Utama GPT-5 Yang Dilaporkan:
- Ralat penjanaan kod (contohnya,
.ends_with
bukannya.endswith
) - Pemprosesan dokumen panjang yang tidak lengkap (700+ baris)
- Ungkapan nalar dipenuhi dengan token yang tidak masuk akal
- Peningkatan kepanjangan yang mengurangkan kegunaan praktikal
- Kekeliruan dalam tugasan penaakulan berbilang langkah
Pertukaran Antara Kreativiti dan Keupayaan
Corak menarik muncul apabila membandingkan respons merentasi generasi model yang berbeza. Model-model awal seperti GPT-1 dan GPT-2 , walaupun mempunyai batasan teknikal, sering menghasilkan kandungan yang lebih kreatif dan menarik. Respons mereka, walaupun kadang-kadang tidak koheren, mempunyai kualiti puitis yang dianggap menginspirasi oleh ramai pengguna untuk kerja kreatif.
Sesetengah perkara sukar untuk dicari di Google, kerana anda tidak dapat membingkai soalan dengan betul. Contohnya anda tahu konteks dan penjelasan yang lemah tentang apa yang anda cari. Pencarian Google tidak akan membawa anda ke mana-mana, LLM akan memberikan jawapan yang betul 95% daripada masa.
Apabila model menjadi lebih berkebolehan, mereka juga menjadi lebih boleh diramal dan bertele-tele. Respons GPT-5 sering bermula dengan pujian berlebihan terhadap soalan pengguna sebelum menyampaikan jawapan panjang seperti esei yang dianggap kurang berguna oleh ramai berbanding respons langsung daripada versi terdahulu.
Kebolehpercayaan Semakan Fakta Kekal Dipertikaikan
Komuniti kekal berpecah mengenai penggunaan model bahasa besar untuk maklumat fakta. Walaupun sesetengah pengguna melaporkan kadar ketepatan tinggi untuk pertanyaan pengetahuan am, yang lain menunjukkan ralat berterusan walaupun dalam fungsi pengaturcaraan asas. Kesan amnesia Gell-Mann - mempercayai sumber dalam bidang yang tidak dikenali walaupun mengetahui ia membuat ralat dalam bidang yang dikenali - terus menjadi kebimbangan di kalangan pengguna teknikal.
Versi moden memang termasuk keupayaan carian dan pautan sitasi, yang membantu dengan pengesahan. Walau bagaimanapun, persoalan asas mengenai kebolehpercayaan berterusan, terutamanya bagi pengguna yang memerlukan ketepatan konsisten dalam kerja mereka.
Corak Keutamaan Pengguna:
- GPT-3.5 kepada GPT-4: Dianggap sebagai lompatan paling ketara
- GPT-4o: Peningkatan ketepatan yang besar, berbaloi dengan langganan USD 20
- Model o1: Peningkatan keupayaan pengekodan yang ketara
- GPT-5: Dilihat sebagai peningkatan kecil atau kemunduran oleh ramai pengguna
Realiti Pasaran Berbanding Pencapaian Teknikal
Sambutan suam-suam kuku terhadap GPT-5 menyerlahkan jurang yang semakin melebar antara pencapaian teknikal dan jangkaan pengguna. Walaupun model menunjukkan penambahbaikan dalam penanda aras tertentu dan tugasan penaakulan, pengalaman praktikal bagi ramai pengguna terasa seperti penurunan taraf. Ketidakselarasan ini telah membawa kepada spekulasi bahawa industri AI mungkin menghampiri had pendekatan latihan semasa.
Perkembangan daripada GPT-3.5 kepada GPT-4 mewakili lonjakan besar dalam keupayaan, menjadikan alat AI benar-benar berguna untuk banyak tugasan. Walau bagaimanapun, penambahbaikan seterusnya lebih bersifat tambahan, dengan setiap model baharu membawa pertukaran daripada kelebihan jelas merentasi semua kes penggunaan.
Situasi semasa menunjukkan bahawa kejayaan seterusnya dalam pembangunan AI mungkin memerlukan pendekatan yang berbeza secara asas daripada sekadar meningkatkan skala model sedia ada. Sehingga itu, pengguna terus mempertikaikan sama ada model AI terkini mewakili kemajuan atau sekadar latihan pemasaran yang mahal.
Rujukan: What would you say if you could talk to a future OpenAl model?