Eksperimen seorang pembangun dengan GPT-5-Codex untuk penyelidikan AI telah mencetuskan perdebatan mengenai keupayaan semasa dan batasan penyelidikan berbantu AI. Projek tersebut melibatkan latihan model bahasa kecil dalam jangka masa lima minit, mendedahkan kedua-dua potensi dan sempadan alat AI semasa.
Struktur Kos:
- Penggunaan GPT-5-Codex: $200 USD sebulan untuk penyelidikan intensif
- Penggunaan token: Perlu dimulakan semula setiap juta token
- Kekangan masa latihan: Maksimum 5 minit untuk latihan model
Semakan Realiti: Penyelidikan Amatur vs Profesional
Respons komuniti menyerlahkan perbezaan penting yang diabaikan oleh eksperimen asal. Beberapa pengamal berpengalaman menunjukkan bahawa perbandingan tersebut tidak begitu bermakna, kerana ia melibatkan seseorang tanpa latar belakang penyelidikan AI formal bersaing dengan sistem AI pada tugas yang agak mudah. Kerja yang diterangkan dicirikan sebagai berada pada tahap kursus pemprosesan bahasa semula jadi pertama pelajar sarjana muda dan bukannya penyelidikan tulen.
Pemerhatian ini menimbulkan soalan penting tentang bagaimana kita menilai keupayaan AI. Apabila alat AI mengatasi prestasi amatur dalam bidang khusus, ia tidak semestinya menunjukkan bahawa kerja peringkat profesional berisiko. Sebaliknya, ia mencadangkan bahawa AI pada masa ini paling berkesan dalam meningkatkan tahap asas - membantu pemula mencapai kecekapan asas dengan lebih cepat.
Perbandingan Keputusan Teknikal:
- Pendekatan manual asal: transformer 1.8M parameter, 9+ perplexity
- Keputusan terbaik dibantu AI: 8.53 perplexity (3 lapisan, 4 kepala, 1441 dimensi)
- Kaedah penyulingan N-gram: Output kualitatif terbaik dengan struktur cerita yang koheren
- Pendekatan shallow fusion: 7.38 perplexity tetapi kualiti teks yang lemah
Implikasi Ekonomi Kerja Berbantu AI
Kebimbangan yang ketara muncul mengenai kesan ekonomi alat-alat ini. Ahli komuniti menyatakan kebimbangan tentang penurunan nilai kemahiran dan kehilangan pekerjaan, terutamanya bagi profesional pertengahan kerjaya. Perbincangan mendedahkan kebimbangan tentang senario di mana pengurusan mungkin mengurangkan saiz pasukan berdasarkan tanggapan peningkatan produktiviti AI, manakala pekerja yang tinggal menghadapi beban kerja yang meningkat dalam menyemak kod yang dijana AI dan bukannya terlibat dalam penyelesaian masalah kreatif.
Sesetengah orang melihatnya sebagai cara untuk menghapuskan masalah sukar supaya mereka boleh fokus pada kerja membosankan. Adakah anda suka mengkod, tetapi benci semakan kod? Teka apa yang anda perlu lakukan lebih banyak sekarang!
Kos 200 dolar Amerika bulanan untuk penggunaan AI intensif juga menyerlahkan kebimbangan kebolehcapaian, mencadangkan bahawa penyelidikan berbantu AI yang berkesan mungkin menjadi keistimewaan yang tersedia terutamanya kepada individu atau organisasi yang mempunyai dana yang mencukupi.
Batasan Teknikal dan Isu Kepercayaan
Eksperimen tersebut mendedahkan beberapa batasan teknikal yang telah dihadapi oleh pengguna berpengalaman merentasi alat penyelidikan AI yang berbeza. Ramai melaporkan bahawa sistem AI berprestasi baik pada mulanya tetapi akhirnya mencapai halangan yang memerlukan campur tangan dan nyahpepijat manusia. Corak ini mencadangkan bahawa alat AI semasa paling berkesan untuk persediaan dan penerokaan awal dan bukannya penyelesaian masalah yang berterusan dan kompleks.
Kepercayaan muncul sebagai isu kritikal yang lain, terutamanya dengan sistem penyelidikan AI yang mempunyai akses terhad kepada sumber data tertentu atau menunjukkan keupayaan penaakulan yang tidak konsisten. Pengguna mencatatkan masalah dengan sistem AI yang menggabungkan sumber yang tidak boleh dipercayai atau gagal membezakan antara maklumat saintifik yang sah dan pseudosains, terutamanya dalam bidang seperti kesihatan dan perubatan.
Alur Kerja Penyelidikan AI:
- Codex mengubah suai skrip latihan dan menjalankan 3-4 eksperimen (~20 minit)
- AI mencadangkan 2-3 pendekatan seterusnya berdasarkan keputusan
- Manusia memilih pendekatan atau kadang-kadang mencadangkan alternatif
- Proses berulang dengan perundingan berkala GPT-5-Pro
Masa Depan Penyelidikan Berbantu AI
Walaupun terdapat batasan, sesetengah pengamal melaporkan pengalaman positif dengan pengkodan suasana dan alur kerja penyelidikan berbantu AI. Kuncinya nampaknya adalah memahami alat-alat ini sebagai penambah produktiviti untuk tugas tertentu dan bukannya pengganti untuk kepakaran mendalam. Aplikasi yang paling berjaya nampaknya melibatkan penggunaan AI untuk prototaip pantas, sapuan parameter, dan mengendalikan tugas pengkodan rutin manakala manusia fokus pada strategi peringkat tinggi dan pengesahan.
Perdebatan akhirnya mencerminkan soalan yang lebih luas tentang pembangunan dan penggunaan AI. Walaupun alat semasa menunjukkan janji untuk mempercepatkan aspek tertentu penyelidikan dan pembangunan, ia masih jauh dari keupayaan penyelidikan autonomi yang mungkin dicadangkan oleh sesetengah bahan pemasaran.