Ciri Pelengkapan Kod AI Tempatan JetBrains Mencetuskan Perdebatan Mengenai Kemahiran Pengaturcaraan dan Pergantungan Alatan

Pasukan Komuniti BigGo

Ciri Pelengkapan Kod AI Tempatan JetBrains Mencetuskan Perdebatan Mengenai Kemahiran Pengaturcaraan dan Pergantungan Alatan

Ciri Full Line Code Completion daripada JetBrains , yang menggunakan model AI tempatan untuk membantu pembangun menulis kod logging, telah mencetuskan perbincangan hangat mengenai peranan kecerdasan buatan dalam pengaturcaraan dan sama ada alatan sedemikian meningkatkan atau mengurangkan kemahiran pembangun.

Ciri ini berjalan sepenuhnya pada mesin tempatan pembangun, menggunakan model padat sebesar 100MB yang boleh meramal dan melengkapkan kenyataan logging berdasarkan konteks kod sekeliling. Tidak seperti pembantu AI berasaskan awan, pendekatan ini mengutamakan privasi dan kelajuan dengan mengekalkan semua pemprosesan secara luar talian.

Spesifikasi Model AI JetBrains:

Saiz model: 100MB (dimampatkan daripada 400MB menggunakan kuantisasi INT8)
Parameter: 100 juta (gaya GPT-2, kemudiannya bertukar kepada seni bina Llama2)
Tetingkap konteks: 384 aksara
Data latihan: 45GB subset daripada dataset The Stack
Perbendaharaan kata tokenizer: 16,384 token
Keperluan perkakasan: Berjalan secara tempatan pada CPU tanpa kebergantungan CUDA


Integrasi AI dalam menulis log meningkatkan produktiviti pembangun, seperti yang diteroka dalam catatan blog

Perpecahan Falsafah Pengaturcaraan yang Besar

Respons komuniti mendedahkan perpecahan asas dalam cara pembangun melihat kraf mereka. Sesetengah pihak berhujah bahawa bergantung kepada AI untuk tugas asas seperti mengingati sama ada menggunakan logger.info atau logging.info mewakili penurunan yang membimbangkan dalam asas pengaturcaraan. Mereka melihat butiran ini sebagai pengetahuan teras yang harus dikekalkan oleh pembangun yang cekap.

Yang lain membalas bahawa menguruskan beban kognitif adalah penting untuk produktiviti, terutamanya apabila bekerja merentasi pelbagai pangkalan kod dengan perpustakaan logging yang berbeza. Mereka melihat bantuan AI sebagai evolusi semula jadi alatan pengaturcaraan, sama seperti bagaimana auto-completion dan syntax highlighting menjadi ciri standard.

Satu perkara yang telah menjadi sangat jelas daripada kegilaan AI ialah betapa ramai orang yang melakukan pengaturcaraan untuk mencari rezeki secara aktif bermusuhan terhadap aplikasi sains komputer yang menarik yang membuka keupayaan dan cara kerja yang baharu sepenuhnya.

Pelaksanaan Teknikal dan Pertukaran

JetBrains mencapai keupayaan AI tempatan ini melalui beberapa pengoptimuman bijak. Mereka melatih model 100 juta parameter khusus pada kod Python , mengeluarkan komen dan import daripada data latihan untuk memberi tumpuan semata-mata pada penjanaan kod. Model itu kemudiannya dimampatkan daripada 400MB kepada 100MB menggunakan teknik kuantisasi.

Walau bagaimanapun, sesetengah pembangun mempersoalkan sama ada ini mewakili penyelesaian terbaik. Pelayan bahasa tradisional dan pelengkapan kod pintar sudah boleh mengendalikan cadangan nama pembolehubah dan pelengkapan sedar konteks dengan ketepatan sempurna dan penggunaan sumber yang minimum. Pengkritik berhujah bahawa menggunakan inferens berasaskan transformer untuk tugas yang boleh diselesaikan dengan sempurna oleh alatan deterministik mewakili pemilihan alatan yang tidak cekap.

Pengoptimuman Latihan:

Mengalih keluar komen kod untuk memberi tumpuan kepada penjanaan kod
Menukar indentasi kepada token <SCOPE_IN>/<SCOPE_OUT>
Mengecualikan penyata import daripada data latihan
Menggunakan tokenizer BPE yang dioptimumkan untuk kod berbanding bahasa semula jadi
Dilatih pada 8 GPU NVIDIA A100 selama beberapa hari

Kontroversi Amalan Terbaik Logging

Perbincangan itu juga menyerlahkan pertimbangan teknikal penting mengenai amalan logging Python . Beberapa pembangun berpengalaman menunjukkan bahawa menggunakan f-strings dalam kenyataan logging, walaupun mudah, boleh menyebabkan masalah prestasi dan mengganggu sistem pengagregatan log seperti Sentry . Pendekatan tradisional menggunakan format strings dengan operator % membolehkan sistem logging mengumpulkan mesej yang serupa bersama-sama dan mengelakkan interpolasi string yang tidak perlu apabila tahap logging dilumpuhkan.

Amalan Terbaik Logging Python:

Disyorkan: logger.info("Message %s", variable)
Elakkan: logger.info(f"Message {variable}")
Sebab-sebab: F-strings menghalang pengagregatan log, menyebabkan masalah prestasi dalam laluan kod yang kerap digunakan, dan boleh melemparkan pengecualian jika pembolehubah mengandungi penentu format


Amalan terbaik dalam logging Python, termasuk penggunaan optimum f-strings, diperlihatkan dalam potongan kod ini

Model AI Tempatan vs Awan

Sifat tempatan pelaksanaan JetBrains menerima pujian meluas daripada pembangun yang mementingkan privasi. Menjalankan inferens secara tempatan menghapuskan kebimbangan mengenai menghantar kod proprietari kepada perkhidmatan luaran sambil menyediakan prestasi yang konsisten tanpa mengira sambungan internet.

Pendekatan ini mewakili trend yang lebih luas ke arah model AI khusus dan khusus domain berbanding perkhidmatan awan tujuan umum. Dengan memberi tumpuan semata-mata pada pelengkapan kod Python dalam tetingkap konteks 384 aksara, JetBrains mencipta alatan yang cekap dan berkesan untuk kes penggunaan khususnya.

Kesimpulan

Perdebatan mengenai pelengkapan kod berkuasa AI JetBrains mencerminkan persoalan yang lebih besar mengenai masa depan pembangunan perisian. Walaupun sesetengah pembangun menerima AI sebagai pengganda produktiviti yang membebaskan mereka untuk memberi tumpuan kepada masalah peringkat tinggi, yang lain bimbang tentang mewujudkan pergantungan yang boleh melemahkan kemahiran pengaturcaraan asas.

Kejayaan model AI tempatan dan khusus seperti pelaksanaan JetBrains menunjukkan bahawa masa depan mungkin termasuk kedua-dua pendekatan: model tujuan umum yang berkuasa untuk tugas kompleks dan alatan ringan dan terfokus untuk aliran kerja khusus. Apabila teknologi semakin matang, pembangun mungkin perlu mencari keseimbangan mereka sendiri antara memanfaatkan bantuan AI dan mengekalkan kecekapan teras.

Rujukan: My favorite use-case for AI is writing logs