Pelancaran GPT-5 OpenAI Menghadapi Bantahan Besar Pengguna Berhubung Penyingkiran Model dan Isu Prestasi

Pasukan Editorial BigGo
Pelancaran GPT-5 OpenAI Menghadapi Bantahan Besar Pengguna Berhubung Penyingkiran Model dan Isu Prestasi

Pelancaran yang sangat dinanti-nantikan bagi GPT-5 OpenAI telah mencetuskan kontroversi besar dalam tempoh 24 jam selepas pelancarannya, apabila pengguna menyatakan rasa tidak puas hati yang meluas terhadap prestasi model baharu dan keputusan syarikat untuk menyingkirkan akses kepada versi terdahulu tanpa amaran. Pelancaran yang bertujuan untuk mempamerkan sistem AI paling canggih OpenAI setakat ini, sebaliknya telah menjadi tumpuan kekecewaan pengguna dan kritikan teknikal.

Seni Bina Revolusioner Bertemu Sambutan Bercampur

GPT-5 memperkenalkan pendekatan yang berbeza secara asas kepada pemprosesan AI melalui sistem kecerdasan bersepadu. Tidak seperti seni bina model tunggal sebelum ini, GPT-5 beroperasi sebagai sistem penghalaan pintar yang menguruskan dua komponen teras: model lalai berkelajuan tinggi untuk tugasan rutin dan GPT-5 Thinking untuk masalah penaakulan yang kompleks. Penghala masa nyata ini menganalisis pertanyaan pengguna untuk menentukan laluan pemprosesan yang sesuai, secara teorinya mengoptimumkan kelajuan dan ketepatan. Pengguna juga boleh mencetuskan analisis yang lebih mendalam secara manual dengan memasukkan frasa seperti sila fikirkan masalah ini dengan mendalam dalam gesaan mereka.

Dakwaan Prestasi Berbanding Pengalaman Pengguna

Data penanda aras OpenAI menunjukkan peningkatan yang mengagumkan merentasi pelbagai domain. Dalam keupayaan kejuruteraan perisian yang diukur melalui ujian SWE-bench, GPT-5 mencapai ketepatan 74.9% berbanding 30.8% bagi GPT-4o. Penaakulan matematik menyaksikan peningkatan yang lebih dramatik, dengan GPT-5 mencapai ketepatan 94.6% pada masalah pertandingan AIME tanpa bantuan alat, jauh lebih tinggi daripada 42.1% bagi GPT-4o. Syarikat juga mendakwa pengurangan 45% dalam ralat fakta berbanding model terdahulu, dengan peningkatan 80% apabila menggunakan mod pemikiran.

Walau bagaimanapun, ujian pengguna dunia sebenar mendedahkan jurang yang ketara antara dakwaan ini dengan prestasi sebenar. Pengguna melaporkan kegagalan asas seperti pengiraan huruf yang salah dalam perkataan mudah seperti blueberry, menghasilkan peta Amerika Syarikat yang tidak masuk akal, dan bergelut dengan persamaan matematik asas yang dikendalikan dengan betul oleh model pesaing. Ralat asas ini telah menimbulkan persoalan tentang kesahihan metodologi ujian penanda aras OpenAI.

Penanda Aras Prestasi GPT-5

Kategori Ujian Skor GPT-5 Skor GPT-4o Penambahbaikan
SWE-bench (Kejuruteraan Perisian) 74.9% 30.8% +144%
Pertandingan Matematik AIME 94.6% 42.1% +125%
Pengurangan Ralat Fakta 45% lebih sedikit ralat daripada GPT-4o - -45%
Pengurangan Ralat Mod Pemikiran 80% lebih sedikit ralat daripada o3 - -80%
Perbandingan senario penyelesaian masalah yang menyerlahkan perbezaan antara jangkaan pengguna dan prestasi model  GPT-5
Perbandingan senario penyelesaian masalah yang menyerlahkan perbezaan antara jangkaan pengguna dan prestasi model GPT-5

Strategi Penyusutan Model Yang Kontroversi

Sumber kemarahan pengguna yang paling ketara berpunca daripada penyingkiran model terdahulu oleh OpenAI tanpa pengumuman, termasuk GPT-4o, o3, dan varian 4.5. Keputusan ini menghapuskan pilihan pengguna semalaman, memaksa semua orang menggunakan sistem GPT-5 baharu tanpa mengira keutamaan atau kes penggunaan khusus mereka. Ramai pengguna telah membangunkan aliran kerja menggunakan model berbeza untuk tujuan yang berbeza, menggunakan GPT-4o untuk tugasan kreatif, o3 untuk penaakulan logik, dan varian lain untuk aplikasi khusus.

Kesan emosi perubahan ini amat ketara, dengan sesetengah pengguna menggambarkan keterikatan mereka kepada model tertentu dalam istilah yang mengejutkan peribadi. Beberapa pengguna melaporkan menggunakan GPT-4o untuk sokongan kesihatan mental, mendapati responsnya lebih empati dan seperti manusia berbanding sistem baharu. Kehilangan akses secara tiba-tiba telah membawa kepada pembatalan langganan dan seruan boikot di seluruh platform media sosial.

Ringkasan Aduan Pengguna

Isu Teknikal:

  • Pengiraan huruf yang tidak tepat dalam perkataan mudah
  • Kegagalan persamaan matematik asas
  • Penjanaan peta geografi yang tidak masuk akal
  • Jurang prestasi berbanding dakwaan penanda aras

Isu Dasar:

  • Penyingkiran semua model terdahulu tanpa pengumuman
  • Migrasi paksa ke sistem GPT-5
  • Pilihan model terhad untuk pengguna bukan Pro
  • Garis masa yang tidak jelas untuk ketersediaan model warisan

Strategi Harga dan Kedudukan Pasaran

Walaupun terdapat kontroversi teknikal, struktur harga GPT-5 mewakili peralihan ketara dalam strategi pasaran OpenAI. Harga API ditetapkan pada dolar Amerika Syarikat 1.25 setiap juta token input dan dolar Amerika Syarikat 10.00 setiap juta token output, dengan varian GPT-5 mini yang lebih ekonomi tersedia. Lebih penting lagi, GPT-5 sedang dilancarkan kepada semua peringkat pengguna, termasuk pengguna percuma yang akan mempunyai akses kepada sistem dengan had penggunaan sebelum ditukar kepada versi mini.

Pendekatan harga agresif ini nampaknya direka untuk menekan pesaing seperti Gemini Google dan Claude Anthropic, terutamanya kerana syarikat-syarikat ini telah membina kedudukan mereka berdasarkan kelebihan khusus seperti pemprosesan konteks panjang dan ciri keselamatan. Langkah ini juga mencabar alternatif sumber terbuka, walaupun projek seperti DeepSeek dan Tongyi Qianwen mungkin mendapat manfaat daripada pengguna yang mencari alternatif kepada ekosistem OpenAI.

Struktur Harga GPT-5

  • Input API: USD 1.25 setiap sejuta token
  • Output API: USD 10.00 setiap sejuta token
  • Pengguna Percuma: Akses kepada GPT-5 dengan had penggunaan, kemudian beralih automatik kepada GPT-5 mini
  • Pengguna Plus: Kuota penggunaan yang lebih tinggi + akses sementara GPT-4o
  • Pengguna Pro: USD 200/bulan untuk pemilihan model manual dan akses GPT-5 Pro
GPT-5 dipromosikan sebagai model terbaik untuk kerja, direka untuk membantu perniagaan dengan pelbagai tugasan dengan lebih cekap
GPT-5 dipromosikan sebagai model terbaik untuk kerja, direka untuk membantu perniagaan dengan pelbagai tugasan dengan lebih cekap

Respons Syarikat dan Kawalan Kerosakan

Menghadapi kritikan yang semakin meningkat, Ketua Pegawai Eksekutif OpenAI Sam Altman dengan pantas mengumumkan beberapa langkah pembetulan melalui media sosial. Syarikat menggandakan had kadar untuk pengguna ChatGPT Plus, menjanjikan peningkatan kecerdasan model, dan yang penting, memulihkan akses kepada GPT-4o untuk pelanggan berbayar. Altman mengakui bahawa pelancaran berjalan lebih perlahan daripada yang dijangkakan dan komited untuk menjadikan pemilihan model lebih telus untuk pengguna.

Keputusan untuk mengembalikan GPT-4o, walaupun sementara, mewakili pengunduran ketara daripada strategi awal OpenAI untuk memaksa pengguna menggunakan sistem baharu. Walau bagaimanapun, syarikat tidak komited kepada ketersediaan jangka panjang model warisan, meninggalkan pengguna tidak pasti tentang akses masa depan kepada alat AI pilihan mereka.

Implikasi Industri dan Pandangan Masa Depan

Kontroversi pelancaran GPT-5 menyerlahkan kerumitan yang semakin meningkat dalam penggunaan model AI apabila sistem ini menjadi lebih terintegrasi dalam aliran kerja harian pengguna. Reaksi emosi yang kuat terhadap perubahan model menunjukkan bahawa syarikat AI mungkin perlu mempertimbangkan semula pendekatan mereka terhadap peralihan produk, terutamanya apabila pengguna membangunkan pergantungan yang lebih mendalam pada tingkah laku dan keupayaan AI tertentu.

Bagi industri AI yang lebih luas, situasi ini menunjukkan bahawa penanda aras teknikal mungkin tidak diterjemahkan secara langsung kepada kepuasan pengguna, terutamanya apabila strategi penggunaan mengganggu corak pengguna yang telah ditetapkan. Insiden ini juga menggariskan kepentingan pilihan pengguna dan ketelusan dalam reka bentuk sistem AI, kerana ciri penukaran automatik yang dipromosikan OpenAI sebagai kelebihan dianggap oleh ramai pengguna sebagai batasan terhadap kawalan dan fleksibiliti mereka.

Grafik promosi yang mempamerkan model GPT-5 yang canggih, menonjolkan keupayaannya di tengah-tengah kebimbangan pengguna dan implikasi industri
Grafik promosi yang mempamerkan model GPT-5 yang canggih, menonjolkan keupayaannya di tengah-tengah kebimbangan pengguna dan implikasi industri