Claude Sonnet 4 Dapat Tetingkap Konteks 1 Juta Token, Tetapi Pembangun Mempersoalkan Nilai Dunia Sebenar

Pasukan Komuniti BigGo
Claude Sonnet 4 Dapat Tetingkap Konteks 1 Juta Token, Tetapi Pembangun Mempersoalkan Nilai Dunia Sebenar

Anthropic telah mengembangkan tetingkap konteks Claude Sonnet 4 daripada 200,000 kepada 1 juta token, menandakan pencapaian teknikal yang ketara dalam pembangunan AI. Peningkatan 5 kali ganda ini membolehkan pembangun memproses keseluruhan pangkalan kod dengan lebih 75,000 baris kod atau menganalisis berpuluh-puluh kertas penyelidikan dalam satu permintaan. Walau bagaimanapun, komuniti pembangun menimbulkan persoalan penting tentang sama ada lebih besar sentiasa lebih baik.

Perbandingan Tetingkap Konteks

  • Claude Sonnet 4 Sebelumnya: 200,000 token
  • Claude Sonnet 4 Baharu: 1,000,000 token (peningkatan 5 kali ganda)
  • Kapasiti Setara: 75,000+ baris kod atau berpuluh-puluh kertas penyelidikan
  • Ketersediaan: Anthropic API (Tier 4), Amazon Bedrock , Google Cloud Vertex AI (akan datang tidak lama lagi)

Harga Konteks Yang Lebih Banyak

Tetingkap konteks yang diperluas datang dengan peningkatan harga yang curam. Untuk gesaan yang melebihi 200,000 token, kos input meningkat dua kali ganda daripada 3 dolar Amerika Syarikat setiap juta token kepada 6 dolar Amerika Syarikat, manakala kos output melonjak daripada 15 dolar Amerika Syarikat kepada 22.50 dolar Amerika Syarikat setiap juta token. Struktur harga ini mencerminkan sifat penskalaan kuadratik mekanisme perhatian dalam model bahasa besar, di mana kos pengiraan meningkat secara eksponen dengan saiz konteks.

Ciri ini kini tersedia melalui API Anthropic untuk pelanggan Tier 4 dan Amazon Bedrock , dengan sokongan Google Cloud Vertex AI akan datang tidak lama lagi. Yang ketara tidak hadir ialah integrasi dengan Claude Code , pembantu pengekodan popular Anthropic , walaupun syarikat itu membayangkan pengembangan masa depan kepada produk lain.

Struktur Harga Claude Sonnet 4

Saiz Konteks Kos Input (USD/MTok) Kos Output (USD/MTok)
≤ 200K token $3 $15
> 200K token $6 $22.50

*MTok = Juta Token

Keraguan Pembangun Tentang Tetingkap Konteks Besar

Walaupun pencapaian teknikal, ramai pembangun menyatakan keraguan tentang faedah praktikal tetingkap konteks yang besar. Komuniti telah mengenal pasti pertukaran kritikal: walaupun lebih banyak konteks menyediakan maklumat menyeluruh, ia sebenarnya boleh mengurangkan kualiti output dengan menjadikan AI lebih terdedah kepada gangguan dan kekeliruan.

Setelah menghabiskan beberapa minggu dengan Claude Code baru-baru ini, saya sampai kepada kesimpulan bahawa nilai bersih untuk saya daripada AI agentik sebenarnya negatif.

Sentimen ini mencerminkan perdebatan yang lebih luas tentang pengurusan konteks yang optimum. Sesetengah pembangun melaporkan bahawa model AI menjadi kurang fokus dan lebih cenderung membuat kesilapan apabila terharu dengan terlalu banyak maklumat, sama seperti bagaimana manusia bergelut untuk mengekalkan perhatian merentas sejumlah besar data.

Dilema Kualiti Konteks

Penyelidikan mencadangkan bahawa model AI mengalami pereputan konteks - kemerosotan prestasi apabila tetingkap konteks berkembang lebih besar. Fenomena ini mencabar andaian bahawa lebih banyak maklumat sentiasa membawa kepada hasil yang lebih baik. Ramai pembangun berpengalaman menyokong tetingkap konteks yang lebih kecil dan dipilih dengan teliti daripada membanjiri model dengan keseluruhan pangkalan kod.

Komuniti telah membangunkan pelbagai strategi untuk menguruskan cabaran ini, termasuk memecahkan kerja kepada fasa, menggunakan fail dokumentasi untuk mengekalkan konteks merentas sesi, dan menggunakan kejuruteraan gesaan yang teliti untuk memastikan model AI fokus pada tugas tertentu.

Hasil Bercampur Merentas Kes Penggunaan

Pengalaman pembangun berbeza dengan ketara berdasarkan kes penggunaan khusus dan tahap kepakaran mereka. Mereka yang bekerja dengan teknologi biasa seperti React dan TypeScript melaporkan peningkatan produktiviti yang besar, manakala pembangun yang menangani masalah kompleks khusus domain sering mendapati bantuan AI kurang membantu atau bahkan tidak produktif.

Teknologi ini kelihatan paling bermanfaat untuk projek lapangan hijau, mempelajari rangka kerja baharu, dan mengendalikan tugas pengekodan rutin. Walau bagaimanapun, untuk perisian peringkat perusahaan dengan keperluan kompleks dan kekangan warisan, hasilnya kekal tidak konsisten.

Kes Penggunaan Utama untuk Konteks Besar

  • Analisis kod berskala besar: Pemahaman menyeluruh pangkalan kod termasuk fail sumber, ujian, dan dokumentasi
  • Sintesis dokumen: Pemprosesan set dokumen yang luas seperti kontrak undang-undang dan kertas penyelidikan
  • Ejen sedar konteks: Mengekalkan konteks merentasi beratus-ratus panggilan alat dan aliran kerja berbilang langkah

Memandang Ke Hadapan

Walaupun tetingkap konteks 1 juta token Anthropic mewakili pencapaian teknikal yang mengagumkan, sambutan bercampur komuniti pembangun menyerlahkan pengajaran penting: keupayaan mentah tidak secara automatik diterjemahkan kepada nilai praktikal. Masa depan pembangunan dibantu AI mungkin bergantung kurang pada saiz tetingkap konteks dan lebih pada pengurusan konteks pintar, pemahaman yang lebih baik tentang bila menggunakan bantuan AI, dan teknik yang diperbaiki untuk mengekalkan fokus model.

Apabila teknologi terus berkembang, pembangun sedang belajar bahawa kejayaan dengan alat AI memerlukan pembangunan kemahiran baharu sekitar kejuruteraan gesaan, kurasi konteks, dan mengetahui bila pendekatan pengekodan tradisional mungkin lebih berkesan daripada bantuan AI.

Nota: Token adalah unit teks yang diproses oleh model AI, kira-kira bersamaan dengan perkataan atau bahagian perkataan. Halaman teks biasa mengandungi kira-kira 500-750 token.

Rujukan: Claude Sonnet 4 now supports 1M tokens of context