Anthropic baru-baru ini mengumumkan ciri pengurusan konteks baharu untuk Claude Sonnet 4.5, termasuk penyuntingan konteks automatik dan alat memori yang direka untuk membantu ejen AI mengendalikan tugasan yang lebih panjang. Walaupun syarikat itu mendakwa peningkatan prestasi yang ketara, pembangun dalam komuniti menimbulkan persoalan penting tentang pelaksanaan praktikal dan keberkesanan ciri-ciri ini.
Ketersediaan:
- Status: Beta awam
- Platform: Claude Developer Platform , Amazon Bedrock , Google Cloud Vertex AI
- Kes Penggunaan Sasaran: Pengekodan, penyelidikan, pemprosesan data dengan ejen yang berjalan lama
![]() |
---|
Meneroka ciri-ciri pengurusan konteks baharu dalam Claude Sonnet 45 di platform Anthropic |
Kebimbangan Teknikal Mengenai Penyuntingan Konteks
Kebimbangan paling ketara berkisar pada penyuntingan konteks, yang secara automatik membuang panggilan alat dan hasil yang lapuk apabila menghampiri had token. Pembangun bimbang pendekatan ini boleh menimbulkan masalah serius. Apabila bahagian konteks dibuang, ia boleh merosakkan andaian bahawa maklumat tertentu kekal tersedia, yang berpotensi membawa kepada halusinasi di mana model AI merujuk data yang tidak lagi hadir.
Seorang pembangun menyerlahkan senario khusus: jika ejen membaca fail dan kemudian menerima arahan untuk perubahan selanjutnya, membuang kandungan fail asal daripada konteks boleh menyebabkan model berhalusinasi, kerana gesaan secara semula jadi merujuk maklumat yang hilang itu. Ini mewujudkan ketegangan asas antara menguruskan had konteks dan mengekalkan perbualan yang koheren.
Ciri-ciri Teknikal Utama:
- Penyuntingan Konteks: Secara automatik membuang panggilan alat yang lapuk dan keputusan apabila menghampiri had token
- Alat Memori: Sistem berasaskan fail untuk menyimpan maklumat di luar tetingkap konteks
- Operasi Sebelah Klien: Pembangun mengekalkan kawalan penuh ke atas penyimpanan data dan kegigihan
- Kegigihan Merentas Sesi: Maklumat dikekalkan merentasi pelbagai perbualan
Persoalan Mengenai Inovasi Berbanding Pemasaran
Beberapa ahli komuniti menyatakan kekeliruan tentang apa yang benar-benar baharu dalam pengumuman Anthropic. Ramai pembangun telah melaksanakan penyelesaian pengurusan konteks yang serupa selama berbulan-bulan menggunakan alat dan API sedia ada. Persoalan teras yang ditanya ialah sama ada Claude Sonnet 4.5 telah disetel halus secara khusus untuk menggunakan alat memori dan penyuntingan konteks ini dengan lebih berkesan, atau jika ini terutamanya peningkatan pengalaman pembangun untuk keupayaan yang sudah mungkin.
Saya telah melakukan sesuatu yang serupa selama sebulan dengan opencode, adakah perkara baharu itu model sonnet baharu disetel halus untuk memanggil alat-alat ini dengan 'lebih baik' atau hanya mereka telah memperbaiki devex untuk mencapai perkara-perkara ini?
Cabaran Pelaksanaan Dunia Sebenar
Syarikat-syarikat yang sudah bekerja dengan ejen AI jangka panjang berkongsi pandangan tentang kerumitan pengurusan konteks. Perbincangan mendedahkan bahawa pengurusan konteks yang berkesan melibatkan lebih daripada sekadar membuang maklumat lama. Ia memerlukan penyelarasan yang teliti bagi berbilang ejen, peringkasan pintar bagi respons besar, dan sistem canggih untuk menghantar konteks antara komponen yang berbeza.
Komuniti juga menunjukkan pertukaran penting yang tidak ditangani sepenuhnya oleh pengumuman Anthropic: keseimbangan antara kelajuan dan ketepatan dalam pengurusan konteks. Peringkasan yang lebih pantas dan pemadatan konteks sering datang dengan kos ketepatan, dan pendekatan optimum berbeza dengan ketara bergantung pada sama ada anda membina produk yang menghadap pengguna atau aplikasi perniagaan.
Tuntutan Prestasi oleh Anthropic:
- Penyuntingan konteks sahaja: 29% peningkatan prestasi
- Penyuntingan konteks + alat memori: 39% peningkatan prestasi
- Pengurangan penggunaan token: 84% dalam penilaian carian web 100-giliran
Persoalan Integrasi Yang Hilang
Walaupun terdapat ciri API baharu, pembangun keliru mengapa keupayaan ini tidak diintegrasikan ke dalam produk Claude Code milik Anthropic sendiri. Ini menimbulkan persoalan tentang kematangan dan kebolehpercayaan ciri-ciri tersebut, serta keyakinan Anthropic dalam menggunakan mereka dalam aplikasi yang menghadap pengguna.
Respons komuniti pembangun menunjukkan bahawa walaupun pengurusan konteks sememangnya cabaran kritikal untuk ejen AI, penyelesaian Anthropic mungkin tidak seterobosan yang dipersembahkan. Ujian sebenar ialah sama ada ciri-ciri ini dapat mengatasi cabaran teknikal yang telah dikenal pasti oleh pembangun dan memberikan peningkatan tulen berbanding pendekatan sedia ada.