"Pelajaran Pahit" AI Menghadapi Ujian Realiti Apabila Model Cekap Mencabar Penskalaan Pengkomputeran Tulen

Pasukan Komuniti BigGo
"Pelajaran Pahit" AI Menghadapi Ujian Realiti Apabila Model Cekap Mencabar Penskalaan Pengkomputeran Tulen

Komuniti AI sedang terlibat dalam perdebatan sengit tentang sama ada melemparkan lebih banyak kuasa pengkomputeran kepada masalah sentiasa merupakan pendekatan terbaik. Perbincangan ini tertumpu pada pelajaran pahit terkenal Rich Sutton - idea bahawa kaedah umum yang menggunakan banyak pengkomputeran akhirnya menang berbanding penyelesaian yang direka manusia. Walaupun prinsip ini seolah-olah menjelaskan kejayaan terkini AI, perkembangan baharu membuatkan penyelidik mempersoalkan kebolehgunaan universalnya.

Visual ini menekankan konsep asas "the bitter lesson" dalam AI, menyediakan pentas untuk perbincangan dalam artikel
Visual ini menekankan konsep asas "the bitter lesson" dalam AI, menyediakan pentas untuk perbincangan dalam artikel

Pendekatan Pengkomputeran-Utama Mencecah Tembok Praktikal

Pelajaran pahit berfungsi dengan baik dalam persekitaran terkawal seperti catur dan Go , di mana peraturan jelas dan kemenangan mudah diukur. Walau bagaimanapun, aplikasi dunia sebenar mengemukakan cabaran yang lebih rumit. Organisasi bergelut dengan proses yang tidak ditakrifkan, kualiti data yang lemah, dan objektif yang menentang pengukuran mudah. Tidak seperti permainan catur dengan peraturan yang jelas, dinamik tempat kerja melibatkan prosedur tidak bertulis dan interaksi manusia yang kompleks yang sukar ditangkap dalam data.

Komuniti telah mencatat bahawa banyak syarikat tidak dapat menentukan matlamat mereka dengan jelas, apatah lagi menyediakan data berkualiti tinggi yang diperlukan untuk pendekatan berat pengkomputeran berfungsi dengan berkesan. Ini mewujudkan masalah asas: tanpa data yang baik dan objektif yang jelas, menambah lebih banyak kuasa pengkomputeran tidak membantu.

Model Cekap Mencabar Naratif Penskalaan

Perkembangan terkini dalam AI menunjukkan bahawa lebih bijak, bukan lebih besar, mungkin lebih baik. Dalam catur, Stockfish kekal tidak terkalahkan walaupun menggunakan pendekatan hibrid yang menggabungkan pengaturcaraan tradisional dengan rangkaian neural kecil, bukannya pembelajaran mendalam tulen. Ia boleh berjalan pada iPhone sambil mengatasi alternatif berat pengkomputeran.

Begitu juga, model baharu yang dipanggil Hierarchical Reasoning Model (HRM) mencapai hasil yang mengagumkan pada penanda aras penaakulan AI menggunakan hanya 27 juta parameter - pecahan kecil berbanding model berbilion parameter. Sementara OpenAI dilaporkan membelanjakan 30,000 dolar Amerika Syarikat setiap tugasan untuk mencapai skor tinggi, HRM mencapai hasil yang serupa dengan sumber pengkomputeran yang jauh lebih sedikit.

Model seperti HRM mungkin boleh berjalan pada telefon anda, sama seperti Stockfish . Ini bukan program tujuan umum, dan mereka tidak cemerlang dengan pengkomputeran yang banyak.

Perbandingan Model:

  • HRM (Hierarchical Reasoning Model): 27 juta parameter, khusus untuk tugas-tugas tertentu
  • Standard LLMs: Berbilion parameter, tujuan umum
  • OpenAI o3: $30,000 USD setiap tugas untuk skor penanda aras tinggi
  • Stockfish: Pendekatan hibrid, berjalan pada iPhone , kekal tidak terkalahkan dalam catur

Perspektif Sepanjang Kerjaya lwn Keperluan Segera

Perbincangan mendedahkan perbezaan penting tentang horizon masa. Sesetengah ahli komuniti berhujah bahawa pelajaran pahit terpakai kepada strategi penyelidikan sepanjang kerjaya, dengan mengandaikan peningkatan perkakasan yang berterusan selama beberapa dekad. Dari pandangan ini, bertaruh pada pendekatan pengkomputeran umum masuk akal untuk arah penyelidikan jangka panjang.

Walau bagaimanapun, untuk aplikasi praktikal segera, penyelesaian khusus sering memberikan hasil yang lebih baik. Syarikat yang membina alat AI hari ini memerlukan penyelesaian yang berfungsi dalam kekangan semasa, bukan keupayaan masa depan teori. Ketegangan antara strategi terokai-lawan-eksploit menjadi penting apabila memutuskan antara melabur dalam pendekatan berskala umum atau penyelesaian cekap yang disasarkan.

Kos Pembuatan:

  • Fab wafer moden: $1-3 bilion USD (semasa)
  • Fab wafer masa depan: Sehingga $20 bilion USD (unjuran)
  • Konteks sejarah: Sekitar tahun 2000, kos sebegini tidak dapat dibiayai

Kekangan Kewangan dan Teknikal Membentuk Realiti

Komuniti telah menimbulkan persoalan tentang siapa yang mendapat manfaat daripada mempromosikan pendekatan berat pengkomputeran. Terdapat kesedaran yang semakin meningkat bahawa penekanan terkini pada penskalaan mungkin dipengaruhi oleh mereka yang menjual sumber pengkomputeran atau mereka yang mempunyai akses kepada bajet pengkomputeran yang besar.

Kos pembuatan untuk cip canggih terus meningkat, dengan kemudahan fabrikasi moden berharga 1-20 bilion dolar Amerika Syarikat. Ini mewujudkan had praktikal tentang berapa banyak pengkomputeran yang boleh digunakan secara realistik untuk masalah, terutamanya untuk organisasi dan penyelidik yang lebih kecil.

Perdebatan mencerminkan persoalan yang lebih luas tentang keutamaan pembangunan AI. Walaupun pendekatan pengkomputeran umum mungkin akhirnya mendominasi, keperluan segera untuk penyelesaian praktikal dan cekap yang berfungsi dalam kekangan dunia sebenar kekal mendesak. Pelajaran pahit mungkin benar dalam jangka panjang, tetapi ia tidak semestinya membimbing keputusan terbaik untuk aplikasi AI hari ini.

Rujukan: Does the Bitter Lesson Have Limits?