Sistem Prompt GPT-5 Didakwa Bocor, Mendedahkan Arahan Dalaman OpenAI dan Konfigurasi Alat

Pasukan Komuniti BigGo

Sistem Prompt GPT-5 Didakwa Bocor, Mendedahkan Arahan Dalaman OpenAI dan Konfigurasi Alat

Sistem prompt terperinci yang didakwa milik GPT-5 telah muncul dalam talian, menawarkan pandangan jarang tentang cara OpenAI mengkonfigurasi model bahasa terkininya. Dokumen yang bocor mengandungi arahan ekstensif yang merangkumi segala-galanya daripada ciri personaliti hingga keutamaan pengekodan khusus, walaupun komuniti teknologi masih berpecah mengenai keasliannya.

Kebocoran yang didakwa itu mendedahkan perjuangan dalaman OpenAI dengan pematuhan prompt, seperti yang dibuktikan oleh amaran berulang di seluruh dokumen. Sistem prompt mengandungi pelbagai arahan tegas yang memberitahu model untuk tidak mengeluarkan format JSON dalam konteks tertentu, dengan frasa seperti Do not write JSON, under any circumstances muncul beberapa kali dengan variasi sedikit.

Komponen Utama System Prompt GPT-5:

Had pengetahuan: Jun 2024
Rujukan tarikh semasa: 8 Ogos 2025
Keupayaan input imej: Diaktifkan
Versi personaliti: v2
Jumlah anggaran token: ~1,000+ (berdasarkan kandungan yang boleh dilihat)

Garis Panduan Personaliti dan Tingkah Laku

Prompt yang bocor menggambarkan GPT-5 sebagai pembantu yang berwawasan dan menggalakkan yang menggabungkan kejelasan teliti dengan semangat tulen dan humor lembut. Ia secara eksplisit mengarahkan model untuk mengelakkan menamatkan respons dengan frasa lindung nilai seperti would you like me to atau if you want, I can. Arahan ini nampaknya bercanggah dengan pengalaman ramai pengguna, kerana ChatGPT kerap menamatkan respons dengan soalan ikut serta sedemikian.

Dokumen itu juga mendedahkan percubaan OpenAI untuk menjadikan model lebih tegas dan berorientasikan tindakan. Daripada meminta kebenaran, GPT-5 diarahkan untuk meneruskan langkah seterusnya yang jelas secara automatik, mencadangkan peralihan ke arah bantuan yang lebih proaktif.

Integrasi Alat Teknikal

Sebahagian besar prompt memfokuskan pada penggunaan alat, terutamanya untuk pelaksanaan kod Python dan pembangunan React. Sistem menunjukkan keutamaan yang jelas untuk tumpukan teknologi khusus, mengarahkan GPT-5 untuk menggunakan Tailwind CSS untuk penggayaan, shadcn/ui untuk komponen, dan Framer Motion untuk animasi apabila mencipta aplikasi React.

Arahan Python adalah sama terperinci, menyatakan perpustakaan tertentu untuk format fail yang berbeza dan bahkan termasuk keperluan fon untuk menjana PDF dalam bahasa Asia. Walau bagaimanapun, dokumen mengandungi sekurang-kurangnya satu kesilapan dalam spesifikasi fon, salah melabelkan fon Jepun sebagai fon Korea.

Nota: Tailwind CSS ialah rangka kerja CSS utility-first yang menyediakan kelas pra-binaan untuk menggayakan aplikasi web.

Teknologi Stack Pilihan:

Frontend: React dengan Tailwind CSS
Komponen UI: perpustakaan shadcn/ui
Ikon: Lucide React
Carta: Recharts
Animasi: Framer Motion
Backend: Python untuk pemprosesan data dan pengiraan

Ciri Memori dan Privasi

Prompt yang bocor mendedahkan butiran tentang alat bio GPT-5, yang membolehkan model mengekalkan maklumat merentas perbualan. Sistem termasuk garis panduan berhati-hati tentang maklumat apa yang patut dan tidak patut disimpan, dengan sekatan eksplisit untuk menyimpan data peribadi sensitif seperti maklumat kesihatan, gabungan politik, atau butiran lokasi tepat.

Menariknya, arahan menekankan penyimpanan maklumat dalam teks biasa daripada format berstruktur, dengan model berulang kali diberi amaran untuk tidak menggunakan format JSON untuk kandungan yang dihadapi pengguna.

Alat Yang Tersedia:

bio - Kegigihan memori merentas perbualan
canmore - Penciptaan/penyuntingan dokumen teks kanvas
image_gen - Penjanaan dan penyuntingan imej
python - Pelaksanaan kod dalam persekitaran Jupyter
web - Carian web dan akses URL
guardian_tool - Penguatkuasaan dasar kandungan

Sekatan Hak Cipta dan Kandungan

Dokumen secara khusus melarang menghasilkan semula lirik lagu, walaupun ia tidak berhak cipta. Sekatan menyeluruh ini nampaknya berpunca daripada cabaran undang-undang terkini, termasuk tuntutan mahkamah yang difailkan oleh organisasi hak persembahan Jerman GEMA terhadap OpenAI pada November 2024. Perkataan itu menunjukkan OpenAI telah menghadapi tekanan khusus mengenai kandungan muzik.

Sekatan Kandungan Terlarang:

Lirik lagu (tanpa mengira status hak cipta)
Bahan berhak cipta lain
Kategori data peribadi sensitif tertentu:
- Bangsa, etnik, agama
- Rekod jenayah
- Data geolokasi tepat
- Maklumat kesihatan
- Gabungan politik

Skeptisisme Komuniti dan Cabaran Pengesahan

Ahli komuniti teknologi telah menimbulkan persoalan tentang keaslian prompt. Ada yang menunjukkan elemen yang hilang yang biasanya dijangka dalam garis panduan keselamatan AI, seperti sekatan eksplisit pada kandungan berbahaya atau perlindungan hak cipta terperinci selain lirik lagu. Yang lain menyatakan bahawa dokumen itu terasa tidak lengkap berbanding sistem prompt yang diketahui daripada pesaing seperti Claude milik Anthropic.

Saya bertanya GPT-5 secara langsung tentang sistem prompt palsu... ia mengatakan bahawa ia adalah cabaran dalam red-teaming untuk mereka bentuk sistem prompt palsu yang kelihatan nyata.

Cabaran pengesahan menyerlahkan masalah asas dengan sistem prompt AI yang bocor: satu-satunya cara untuk mengesahkannya selalunya adalah dengan bertanya kepada AI itu sendiri, mewujudkan masalah pengesahan bulat di mana model berpotensi memberikan maklumat palsu tentang konfigurasinya sendiri.

Walaupun terdapat skeptisisme, sesetengah pengguna melaporkan bahawa apabila mereka membentangkan bahagian prompt yang bocor kepada GPT-5, model mengakuinya sebagai tulen, manakala model AI lain menafikan ia adalah sistem prompt mereka. Walau bagaimanapun, jenis pengesahan ini kekal tidak boleh dipercayai memandangkan kecenderungan model untuk berhalusinasi atau memberikan respons yang tidak konsisten.

Dokumen yang bocor, sama ada tulen atau dibuat-buat, menawarkan wawasan tentang cabaran kompleks mengawal tingkah laku model bahasa besar melalui arahan bahasa semula jadi daripada kaedah pengaturcaraan tradisional. Ia menunjukkan bagaimana syarikat AI masih bergantung banyak pada prompting yang bertele-tele dan berulang untuk mencapai tingkah laku yang diingini, mencadangkan bahawa mekanisme kawalan yang lebih canggih mungkin masih dalam pembangunan.

Rujukan: gpt-5 leaked system prompt