DeepWiki Menghadapi Bantahan Kerana Dokumentasi Yang Dijana AI Tidak Tepat Untuk Projek Sumber Terbuka

Pasukan Komuniti BigGo
DeepWiki Menghadapi Bantahan Kerana Dokumentasi Yang Dijana AI Tidak Tepat Untuk Projek Sumber Terbuka

DeepWiki , alat berkuasa AI yang secara automatik menjana dokumentasi untuk repositori GitHub , mendapat kritikan daripada penyelenggara sumber terbuka yang mengatakan ia menghasilkan maklumat yang mengelirukan tentang projek mereka. Alat ini, yang dicipta oleh Copilotric (pasukan di sebalik jurutera perisian AI viral Devin ), menukar mana-mana repositori GitHub kepada laman dokumentasi gaya wiki yang boleh dinavigasi.

Ciri-ciri DeepWiki :

  • Menukar repositori GitHub kepada dokumentasi bergaya wiki yang boleh dinavigasi
  • Menawarkan dua mod: Pantas (jawapan berulang daripada graf kod) dan Penyelidikan Mendalam (pengimbasan berbilang fail)
  • Menyediakan jawapan berasas dengan sitasi empat peringkat kembali kepada fail sumber
  • Tersedia melalui antara muka web atau integrasi pelayan MCP dengan AI IDE
  • Akses API percuma untuk pembangun

Masalah Ketepatan Melanda Projek Popular

Beberapa penyelenggara telah menemui kesilapan ketara dalam dokumentasi yang dijana secara automatik oleh DeepWiki . Projek LibreOffice mendapati dirinya berurusan dengan maklumat sistem pembinaan yang sama sekali tidak betul, dengan DeepWiki secara palsu mendakwa projek tersebut menggunakan Buck sebagai sistem pembinaan utamanya. Begitu juga, penyelenggara projek yang lebih kecil melaporkan menemui penerangan yang tidak tepat secara halus yang boleh mengelirukan pembangun beberapa bulan kemudian.

Isu ketepatan nampaknya berpunca daripada cara AI mentafsir struktur kod dan konvensyen penamaan. Dalam sesetengah kes, alat tersebut tertumpu pada fail besar atau konfigurasi lapuk, terlepas komponen kritikal yang dipecahkan merentasi berbilang fail yang lebih kecil. Untuk projek kompleks seperti LLVM , pengguna melaporkan bahawa DeepWiki sama sekali meninggalkan alat penting seperti TableGen sambil terlalu menekankan komponen yang kurang penting.

Isu-isu yang Dilaporkan:

  • LibreOffice: Salah mengenal pasti Buck sebagai sistem pembinaan utama (sebenarnya menggunakan Make )
  • LLVM: Kehilangan komponen kritikal seperti TableGen dan laluan InstCombine
  • Compiler Explorer: Penerangan fail sifat yang tidak tepat secara halus
  • Umum: Tumpuan berlebihan pada fail besar sambil terlepas komponen yang diedarkan

Dokumentasi Tanpa Kebenaran Mencipta Kekeliruan

Kebimbangan utama dalam kalangan pembangun ialah DeepWiki menjana dokumentasi untuk mana-mana repositori awam tanpa kebenaran daripada penyelenggara. Ini mewujudkan situasi bermasalah di mana pendatang baru kepada projek mungkin menemui dokumentasi yang dijana AI melalui enjin carian dan menganggapnya sebagai dokumentasi projek rasmi.

Jadi pada akhirnya orang ramai akan percaya bahawa ini adalah dokumen rasmi...

Isu ini mencerminkan masalah yang dihadapi komuniti OCaml dan Julia dengan ladang kandungan yang mencipta bahan pembelajaran yang dioptimumkan SEO tetapi tidak tepat. Penyelenggara bimbang bahawa dokumentasi DeepWiki boleh mendapat kedudukan lebih tinggi dalam hasil carian berbanding dokumentasi projek sebenar, membawa kepada kekeliruan meluas dalam kalangan penyumbang baharu.

Proses Menarik Diri:

  • Tiada mekanisme permintaan penyingkiran yang jelas pada awalnya
  • Penyelenggara melaporkan kejayaan melalui hubungan terus e-mel
  • Sesetengah pembangun mengancam tindakan undang-undang berhubung kebimbangan maklumat salah
  • Pencipta alat bertindak balas kepada permintaan penyingkiran yang sopan

Sambutan Bercampur Walaupun Berguna

Tidak semua maklum balas adalah negatif. Sesetengah pembangun memuji DeepWiki kerana membantu mereka memahami pangkalan kod yang tidak dikenali dengan cepat dan menjana gambaran keseluruhan seni bina yang berguna. Keupayaan alat untuk menjawab soalan khusus tentang struktur kod dan menyediakan rujukan berpautan kepada fail sumber telah terbukti berharga untuk kes penggunaan tertentu.

Walau bagaimanapun, malah penyokong mengakui batasan. Rajah dan penjelasan yang dijana secara automatik cenderung terlalu tinggi peringkat untuk kerja kejuruteraan, kurang ketepatan yang diperlukan untuk tugas pembangunan sebenar. Pengguna melaporkan bahawa walaupun alat boleh memberikan gambaran keseluruhan umum, ia sering terlepas butiran pelaksanaan penting yang diperlukan pembangun.

Cabaran Dokumentasi AI Yang Lebih Luas

Kontroversi DeepWiki menyerlahkan ketegangan yang semakin meningkat dalam komuniti sumber terbuka tentang alat AI yang beroperasi tanpa kebenaran eksplisit. Walaupun teknologi menawarkan faedah tulen untuk pemahaman kod, masalah ketepatan dan kekurangan kawalan penyelenggara menimbulkan persoalan tentang penggunaan AI yang bertanggungjawab dalam alat pembangun.

Buat masa ini, sesetengah penyelenggara mengambil tindakan sendiri, sama ada meminta penyingkiran projek mereka atau menambah komen penjelasan kepada kod mereka untuk mencegah salah tafsir AI. Situasi ini menggariskan keperluan untuk kerjasama yang lebih baik antara pencipta alat AI dan komuniti sumber terbuka yang mereka sasarkan untuk dilayani.

Rujukan: DeepWiki: Understand Any Codebase