Dalam dunia kecerdasan buatan yang berkembang pesat, cara model bahasa besar berfikir telah menjadi salah satu bidang penyelidikan dan pembangunan yang paling menarik. Perbincangan terkini dalam kalangan pembangun dan peminat AI berpusat pada ANTML (Anthropic Markup Language), satu sistem khusus berasaskan XML yang digunakan oleh Anthropic untuk mengawal proses penaakulan Claude. Bahasa markup tersembunyi ini mendedahkan banyak perkara tentang bagaimana sistem AI moden menyusun pemikiran dalaman mereka sebelum memberikan respons yang sempurna kepada pengguna.
Realiti Teknikal di Sebalik ANTML
Komuniti pembangun dengan pantas mengenal pasti bahawa ANTML sebenarnya bukan teknologi baharu yang revolusioner, tetapi lebih kepada aplikasi praktikal piawaian XML sedia ada dengan ruang nama khusus. Seperti yang dinyatakan oleh seorang pengulas, pendekatan ini memanfaatkan tepat apa yang direka untuk ruang nama XML - mengelakkan pertembungan tag sambil mengekalkan struktur. Tag seperti <thinking> dan <function_calls> berfungsi sebagai token khas yang model kenali daripada latihannya, membolehkan API Anthropic memisahkan penaakulan dalaman Claude daripada output akhirnya. Pelaksanaan teknikal ini menunjukkan bagaimana syarikat AI membina atas piawaian web yang mantap dan bukannya mencipta sistem baharu sepenuhnya dari awal.
Ini adalah token khas yang model dilatih, dan merupakan sebahagian daripada perbendaharaan katanya. Runtime model mengenali ini sebagai token khas.
Tag ANTML Utama yang Dikenal Pasti dalam Perbincangan Komuniti:
<thinking>/</thinking>- Merangkumi proses penaakulan model<function_calls>- Menandakan operasi panggilan fungsi- Parameter konfigurasi seperti
thinking_modedanmax_thinking_length
Revolusi Penaakulan dan Batasannya
Apa yang menjadikan ANTML amat menarik kepada pembangun adalah bagaimana ia membolehkan pemikiran lanjutan - keupayaan untuk Claude menyelesaikan masalah kompleks langkah demi langkah sebelum memberikan jawapan. Walau bagaimanapun, beberapa ahli komuniti telah memerhatikan apa yang mereka namakan sebagai keruntuhan mod penaakulan dalam model yang lebih baharu. Versi awal model penaakulan menunjukkan jejak pemikiran mental yang lebih mentah dan telus yang pembangun anggap berharga untuk memahami tingkah laku model. Apabila model berkembang, pemikiran ini menjadi lebih berstruktur dan kurang boleh dikawal melalui kejuruteraan prompt. Komuniti melihat ini sebagai perkembangan yang ironik, memandangkan pembekal secara serentak membuat jejak penaakulan lebih sukar untuk diakses melalui API untuk mengelakkan penyulingan model.
Teka-teki Panggilan Alat
Titik perbincangan penting berkisar tentang bagaimana model AI mengendalikan panggilan fungsi dan penggunaan alat. Pendekatan semasa menggunakan tag markup khusus seperti <function_calls> telah menimbulkan persoalan sama ada terdapat kaedah yang lebih baik tersedia. Sesetengah pembangun tertanya-tanya mengapa pembekal model belum beralih melebihi sekadar mengarahkan model untuk bertindak balas dengan JSON khas dalam prompt sistem. Alternatif yang disebut termasuk tatabahasa bebas konteks dan teknik persampelan yang lebih canggih, walaupun ini sering masih menerangkan struktur JSON di bawahnya. Ketahanan pendekatan seperti XML mencadangkan bahawa walaupun teknologi ini kelihatan asas, ia masih berkesan untuk tugas kompleks menyusun penaakulan AI dan interaksi alat.
Perbandingan Pendekatan Pelaksanaan Penaakulan:
- Anthropic's ANTML: Ruang nama XML dengan token khas
- Llama.cpp/vLLM: Memindahkan penaakulan ke medan
reasoning_contentyang berasingan - Tatabahasa bebas konteks: Pendekatan alternatif yang masih sering mengeluarkan JSON
- Raw prompting: Arahan asas "berfikir langkah demi langkah"
Melihat ke Hadapan: Masa Depan Penaakulan AI
Perbincangan berterusan tentang ANTML mencerminkan persoalan yang lebih luas tentang betapa telusnya penaakulan AI sepatutnya dan bentuk yang sepatutnya diambil. Apabila model menjadi lebih berkebolehan, ketegangan antara memberikan jejak penaakulan yang berguna dan melindungi teknologi proprietari terus berkembang. Eksperimen komuniti dengan tag dan parameter pemikiran menunjukkan kedua-dua rasa ingin tahu tentang bagaimana sistem ini berfungsi dan keperluan praktikal untuk penyahpepijatan dan penambahbaikan aplikasi AI. Walaupun ANTML mungkin tidak mewakili kejayaan asas dalam bahasa markup, ia berfungsi sebagai tingkap penting ke dalam bagaimana syarikat AI terkemuka menangani cabaran menjadikan penaakulan AI berkesan dan boleh dikawal.
Pembangunan ANTML dan sistem yang serupa menandakan fasa penting dalam evolusi AI - di mana proses dalaman model bahasa besar menjadi berstruktur, boleh diurus, dan semakin kelihatan kepada pembangun. Apabila teknologi terus maju, keseimbangan antara ketelusan, kebolehgunaan, dan perlindungan harta intelek kemungkinan besar akan kekal sebagai topik perbincangan utama dalam komuniti pembangunan AI.
