Model AI Mendapat Tempat Kedua dalam Kejohanan Pengaturcaraan Dunia Manakala Kemenangan Manusia Mencetuskan Perdebatan Komuniti

Pasukan Komuniti BigGo
Model AI Mendapat Tempat Kedua dalam Kejohanan Pengaturcaraan Dunia Manakala Kemenangan Manusia Mencetuskan Perdebatan Komuniti

Komuniti pengaturcaraan sedang hangat berbincang selepas model AI tersuai OpenAI mencapai kedudukan kedua yang mengagumkan di AtCoder World Tour Finals 2025 , tewas tipis kepada pesaing manusia yang keletihan Przemysław Dębiak dengan hanya 9.5 peratus. Walaupun tajuk berita memfokuskan kepada kemenangan manusia, ahli komuniti menunjukkan bahawa prestasi AI mungkin lebih signifikan daripada yang kelihatan pada mulanya.

Keputusan Pertandingan:

  • Pemenang Manusia ( Psyho ): 1,812,272,558,909 mata
  • Model OpenAI : 1,654,675,725,406 mata
  • Margin: 9.5% perbezaan
  • Hadiah: 500,000 JPY (~3,367 USD)
  • Tempoh: 10 jam
  • Peserta: 12 pengaturcara terbaik di seluruh dunia + 1 model AI

Prestasi AI Mencabar Andaian Penyelesaian Masalah Berdurasi Panjang

Format maraton 10 jam telah mencetuskan perbincangan teknikal yang menarik di kalangan pengaturcara. Sesetengah ahli komuniti pada mulanya mengandaikan bahawa model AI akan bergelut dengan sesi penyelesaian masalah yang berpanjangan, menjangkakan mereka akan mencapai tahap mendatar selepas percubaan awal. Walau bagaimanapun, skor akhir yang rapat menunjukkan sebaliknya. AI mengekalkan prestasi yang kompetitif sepanjang pertandingan, menamatkan dengan 1,654,675,725,406 mata berbanding 1,812,272,558,909 mata pemenang.

Ini mencabar kepercayaan umum bahawa model bahasa besar tidak bertambah baik dengan masa berfikir yang lebih lama. Persaingan yang agak ketat menunjukkan AI terus membuat kemajuan bermakna sepanjang jangka masa yang dipanjangkan, bukannya terbantut selepas percubaan awal.

Komuniti Mempersoalkan Operasi dan Keadilan AI

Butiran teknikal tentang bagaimana model AI beroperasi semasa pertandingan telah menjadi titik fokus perbincangan komuniti. Pengaturcara ingin tahu sama ada model tersebut menerima gesaan manusia yang berterusan atau bekerja secara autonomi daripada gesaan awal. Persoalan operasi ini penting untuk memahami sifat sebenar perbandingan manusia-lawan-AI.

Pertandingan menggunakan perkakasan yang sama untuk semua peserta, memastikan medan yang saksama. Walau bagaimanapun, ahli komuniti menyatakan bahawa perbezaan asas antara pendekatan penyelesaian masalah manusia dan AI menjadikan perbandingan langsung kompleks.

Pengiktirafan Melebihi Ganjaran Kewangan

Pemenang menerima 500,000 yen Jepun (kira-kira 3,367 dolar Amerika ), yang diperhatikan oleh pemerhati komuniti sebagai pampasan yang sederhana untuk usaha yang begitu intensif. Dębiak , bekas pekerja OpenAI , telah memperoleh keterlihatan yang ketara dalam kalangan teknologi berikutan kemenangannya.

Jumlah hadiah menyerlahkan bagaimana pengaturcaraan kompetitif sering mengutamakan prestij dan demonstrasi kemahiran berbanding ganjaran kewangan, serupa dengan pertandingan intelektual lain.

Kemajuan Pesat AI Menimbulkan Persoalan Masa Depan

Perbincangan komuniti mendedahkan kesedaran yang semakin meningkat tentang keupayaan AI yang semakin pesat dalam tugas-tugas pengekodan. Penanda aras terkini menunjukkan penyelesaian masalah pengekodan AI melonjak daripada 4.4% kejayaan pada 2023 kepada 71.7% pada 2024. Trajektori peningkatan dramatik ini menyebabkan pengaturcara tertanya-tanya berapa lama kelebihan manusia akan berterusan.

Sekarang bayangkan di mana kita akan berada dalam 10 tahun, dan di mana kita berada 10 tahun yang lalu. Keadaan bergerak dengan pantas.

Persamaan pertandingan dengan John Henry bergema dengan ramai ahli komuniti yang melihat ini sebagai berpotensi salah satu daripada kemenangan manusia yang jelas terakhir dalam pengaturcaraan kompetitif. Tidak seperti pengakhiran tragis cerita rakyat tersebut, pengaturcara ini terselamat daripada usaha maratonnya, tetapi pertandingan masa depan mungkin menceritakan kisah yang berbeza.

Garis Masa Kemajuan Pengkodan AI:

  • 2023: AI menyelesaikan 4.4% masalah pengkodan pada SWE-bench
  • 2024: AI menyelesaikan 71.7% masalah pengkodan pada SWE-bench
  • 2024: Lebih 90% pembangun menggunakan alat pengkodan AI
  • 2025: Peletakan top-3 AI pertama dalam pertandingan pengkodan utama

Memandang ke Hadapan

Komuniti pengaturcaraan kelihatan terbahagi antara meraikan kecerdikan manusia dan mengakui keupayaan AI yang mengagumkan. Walaupun sesetengah memfokuskan kepada kemenangan manusia, yang lain menekankan bahawa model AI yang mendapat tempat kedua di kalangan 12 pengaturcara terbaik dunia mewakili pencapaian penting.

Memandangkan model AI terus bertambah baik dan pertandingan seperti AtCoder menyediakan medan ujian, komuniti memerhati dengan kedua-dua kekaguman dan ketidakpastian tentang masa depan persaingan manusia-AI dalam pengaturcaraan.

Rujukan: Exhausted man defeats AI model in world coding championship