Pembangun Membina "Kilang AI" Menggunakan Pelbagai Model Claude untuk Menjana dan Mengesahkan Kod Secara Automatik

Pasukan Komuniti BigGo

Pembangun Membina "Kilang AI" Menggunakan Pelbagai Model Claude untuk Menjana dan Mengesahkan Kod Secara Automatik

Semakin ramai pembangun sedang bereksperimen dengan aliran kerja AI yang canggih yang menggunakan pelbagai model bahasa bekerja bersama untuk merancang, menulis, dan mengesahkan kod secara automatik. Pendekatan ini, yang digelar kilang AI, mewakili peralihan daripada bantuan AI yang mudah kepada saluran pembangunan automatik yang kompleks.

Pendekatan Kilang: Pelbagai Model, Peranan Khusus

Konsep teras melibatkan pemberian peranan khusus kepada model AI yang berbeza dalam proses pembangunan. Susunan seorang pembangun menggunakan model o3 Claude untuk perancangan, Sonnet 4 untuk pelaksanaan, dan kedua-dua model untuk pengesahan. Setiap model berjalan dalam pokok kerja git yang berasingan, membolehkan pelbagai ciri dibangunkan serentak tanpa gangguan.

Aliran kerja mengikuti proses tiga langkah: pertama, o3 menjana pelan pelaksanaan terperinci berdasarkan keperluan peringkat tinggi. Seterusnya, model pelaksanaan menulis kod sebenar mengikut pelan ini, membuat komit pada setiap langkah untuk mudah dikembalikan. Akhirnya, model pengesahan menyemak output terhadap keperluan asal, dengan sebarang isu disuapkan kembali ke dalam templat perancangan dan bukannya diperbaiki secara manual.

Pokok kerja Git: Ciri Git yang membolehkan pelbagai direktori kerja daripada repositori yang sama, membolehkan pembangunan selari pada cawangan yang berbeza.

Komponen Aliran Kerja Kilang AI:

Model Perancangan: Claude o3 untuk menjana pelan pelaksanaan dan bertanya soalan penjelasan
Model Pelaksanaan: Sonnet 3.7 atau Sonnet 4 untuk menulis kod berdasarkan pelan
Model Pengesahan: Sonnet 4 dan o3 untuk menyemak kod mengikut keperluan asal
Infrastruktur: Git worktrees untuk pembangunan selari, MCP ( Model Context Protocol ) untuk integrasi alat

Betulkan Input, Bukan Output: Falsafah Pembangunan Baharu

Peralihan paling ketara dalam pendekatan ini ialah prinsip tidak pernah mengedit kod yang dijana secara manual. Apabila sesuatu tidak kena, pembangun menyesuaikan gesaan, pelan, atau pemilihan model dan bukannya menampal output secara langsung. Ini mewujudkan sistem yang memperbaiki diri di mana pengajaran yang dipelajari daripada kegagalan secara automatik meningkatkan penjanaan kod masa hadapan.

Perbincangan komuniti mendedahkan pengalaman bercampur dengan metodologi ini. Sesetengah pembangun melaporkan kejayaan dengan projek peribadi dan pangkalan kod yang lebih kecil, manakala yang lain bergelut dengan konsistensi merentas pelbagai ejen yang bekerja pada projek yang sama. Cabaran menjadi sangat ketara dalam sistem pengeluaran yang lebih besar di mana ejen AI yang berbeza mungkin mempunyai idea seni bina yang bercanggah.

Batasan Utama yang Dikenal Pasti oleh Komuniti:

Isu Ketekalan: Pelbagai ejen mencipta keputusan seni bina yang bercanggah
Pengurusan Konteks: Fail arahan boleh berkembang hingga beribu-ribu baris, menggunakan tetingkap konteks
Kesediaan Pengeluaran: Bergelut dengan penyahpepijatan kompleks dan integrasi kod warisan
Kepakaran Domain: Keberkesanan terhad untuk masalah novel yang tidak terdapat dalam data latihan

Kebimbangan Kos dan Kebolehskalaan

Aspek kewangan menjalankan pelbagai model AI serentak telah mencetuskan perdebatan yang besar. Walaupun sesetengah pembangun melaporkan membelanjakan kurang daripada 1 dolar Amerika untuk perundingan model sekunder melalui perkhidmatan seperti OpenRouter , yang lain dengan langganan Claude Max bernilai 200 dolar Amerika mendapati diri mereka membakar had harian dengan cepat apabila menjalankan ejen selari.

Persoalan kebolehskalaan melangkaui kos kepada kualiti kod. Beberapa pembangun berpengalaman menyatakan bahawa walaupun kilang AI berfungsi dengan baik untuk tugas rutin dan projek lapangan hijau, mereka bergelut dengan penyahpepijatan yang kompleks, integrasi kod warisan, dan masalah khusus domain yang memerlukan kepakaran teknikal yang mendalam.

Perbandingan Kos untuk Pembangunan AI:

Langganan Claude Max : $200 USD/bulan dengan had penggunaan yang tinggi
Langganan Claude Pro : $20 USD/bulan dengan had yang lebih terhad
API OpenRouter : ~$0.50 USD penggunaan daripada kredit $10 USD untuk perundingan model sekunder
Kos API tradisional: 10 kali ganda lebih mahal daripada langganan Claude Code untuk penggunaan yang setara

Aplikasi Dunia Sebenar dan Had

Pengguna awal mendapati kejayaan dalam kes penggunaan tertentu. Pendekatan ini menunjukkan potensi untuk menjana kod boilerplate, integrasi API, dan dokumentasi. Walau bagaimanapun, maklum balas komuniti mencadangkan had yang ketara apabila berurusan dengan sistem pengeluaran yang kompleks, senario penyahpepijatan yang rumit, atau cabaran teknikal novel yang tidak diwakili dengan baik dalam data latihan.

Kebanyakan hari-ke-hari saya dalam clojure saya cenderung menggunakan sonnet 4 untuk mendapatkan kurungan yang betul.

Teknologi ini kelihatan paling berkesan untuk pembangun yang boleh memberikan panduan seni bina yang kuat sambil membiarkan AI mengendalikan butiran pelaksanaan. Ini menunjukkan bahawa daripada menggantikan pengaturcara, kilang AI ini mungkin membentuk semula peranan ke arah reka bentuk sistem peringkat tinggi dan jaminan kualiti.

Perdebatan berterusan sama ada ini mewakili peralihan asas dalam pembangunan perisian atau sekadar evolusi alat pengekodan berbantu AI yang sedia ada. Yang jelas ialah pembangun secara aktif bereksperimen dengan aliran kerja AI yang semakin canggih, menolak sempadan kemungkinan dengan model bahasa semasa.

Rujukan: Building a Personal AI Factory (July 2025 snapshot)