Whispering , aplikasi transkripsi sumber terbuka yang menjanjikan privasi local-first, mendapat perhatian komuniti mengenai amaran keselamatan dan dakwaan yang bercanggah tentang pengendalian data. Aplikasi yang dibina dengan Rust dan JavaScript ini meletakkan dirinya sebagai alternatif yang fokus kepada privasi berbanding perkhidmatan transkripsi berasaskan awan.
Perkhidmatan Transkripsi yang Disokong
- API Awan: OpenAI , Groq , Anthropic , Google , ElevenLabs , Deepgram
- Pilihan Tempatan: Integrasi Speaches.ai , Whisper C++ (dalam pembangunan)
- Platform: Desktop ( Windows , macOS , Linux ), Aplikasi Web
- Susunan Teknologi: Backend Rust , frontend JavaScript / TypeScript , rangka kerja Tauri
Windows Defender Menandai Fail Pemasangan
Beberapa pengguna melaporkan bahawa Windows Defender menandai fail pemasangan Whispering sebagai dijangkiti. Amaran keselamatan ini nampaknya berpunca daripada penggunaan aplikasi terhadap crate Rust enigo, yang membolehkan perisian menulis teks terus ke kedudukan kursor. Fungsi ini, yang sering dipanggil keyboard wedge, biasanya mencetuskan positif palsu dalam perisian keselamatan kerana ia meniru tingkah laku keylogger berniat jahat.
Imbasan VirusTotal menunjukkan hasil bercampur-campur merentasi versi yang berbeza. Fail boleh laku 7.3.0 terkini menunjukkan tanda daripada Arctic Wolf (ditandai sebagai Tidak Selamat) dan kedua-dua AVG serta Avast (diklasifikasikan sebagai Program Yang Berpotensi Tidak Diingini). Walau bagaimanapun, versi pemasang MSI menunjukkan hasil yang lebih bersih dengan kebimbangan keselamatan yang lebih sedikit.
Nota: Keyboard wedge ialah perisian yang memintas atau mensimulasikan input papan kekunci, membolehkan program menaip teks secara automatik.
Keputusan Imbasan Keselamatan (VirusTotal)
- Versi 7.3.0 EXE: Dibenderakan oleh Arctic Wolf (Tidak Selamat), AVG & Avast (PUP)
- Versi 7.3.0 MSI: Keputusan bersih, tiada bendera segera
- Versi 7.2.1/7.2.2 MSI: Tiada bendera dikesan
- Versi 7.2.1/7.2.2 EXE: 3 bendera (ArcticWolf Tidak Selamat, AVG & Avast PUP)
Dakwaan Privasi Diserang Komuniti
Walaupun pemasaran yang meluas mengenai operasi local-first, pengguna mempersoalkan sama ada Whispering benar-benar menyimpan data pada peranti. Kekeliruan timbul daripada video demo aplikasi, yang menunjukkan langkah konfigurasi untuk perkhidmatan API luaran termasuk Groq , OpenAI , Anthropic , Google , dan ElevenLabs .
Teks di sini mengatakan semua data kekal pada peranti dan menekankan betapa anda boleh mempercayainya... tetapi langkah pertama ialah mengkonfigurasi token akses untuk perkhidmatan luaran? Adakah perkhidmatan yang ditunjukkan melakukan transkripsi sebenar, mendengar segala yang saya katakan?
Ketidakselarasan antara dakwaan pemasaran dan fungsi sebenar ini telah menyebabkan bakal pengguna tidak pasti tentang model privasi sebenar aplikasi. Walaupun aplikasi menyokong transkripsi tempatan melalui integrasi Speaches.ai , aliran kerja utama nampaknya bergantung kepada perkhidmatan berasaskan awan dengan kunci API yang disediakan pengguna.
Sokongan Transkripsi Tempatan Masih Dalam Pembangunan
Pasukan pembangunan sedang giat bekerja untuk menangani batasan transkripsi tempatan. Kemas kini utama yang menambah sokongan Whisper C++ sedang dalam proses, yang sepatutnya menyediakan fungsi luar talian yang lebih meluas. Kemas kini ini mewakili langkah penting ke arah memenuhi janji local-first aplikasi.
Ahli komuniti juga meminta sokongan untuk model yang lebih baharu seperti Parakeet , yang menawarkan prestasi yang jauh lebih pantas daripada model Whisper tradisional. Laporan awal mencadangkan Parakeet boleh mencapai kelajuan transkripsi masa nyata 3000x pada perkakasan mewah dan 5x masa nyata walaupun pada CPU komputer riba, sambil mengekalkan ketepatan yang lebih baik daripada Whisper-large-v3 .
Perbandingan Prestasi: Parakeet vs Whisper
- Parakeet: 3000x masa nyata pada GPU A100, 5x masa nyata pada CPU komputer riba
- Whisper: Prestasi garis dasar standard
- Ketepatan: Parakeet dilaporkan lebih tepat daripada whisper-large-v3
- Ketersediaan: Sokongan Parakeet diminta tetapi belum dilaksanakan dalam Whispering
Persaingan dalam Ruang Sumber Terbuka
Whispering menghadapi persaingan daripada alternatif yang telah mantap seperti VoiceInk untuk macOS dan MacWhisper , kedua-duanya menawarkan fungsi yang serupa dengan pendekatan berbeza terhadap pemprosesan tempatan. VoiceInk menyediakan kawalan kunci pintas yang mudah dan maklum balas visual, manakala MacWhisper menawarkan harga pembelian sekali dan kemas kini berkala.
Landskap yang lebih luas termasuk pelbagai alat berasaskan Whisper , walaupun kebanyakannya kekal sebagai pembungkus di sekeliling model Whisper teras dan bukannya pendekatan yang berbeza secara asas terhadap pengecaman pertuturan.
Perbincangan komuniti menyerlahkan permintaan yang semakin meningkat untuk alat transkripsi local-first yang benar-benar boleh menyamai kemudahan perkhidmatan awan sambil mengekalkan privasi pengguna. Semasa Whispering meneruskan pembangunan, menangani kebimbangan keselamatan dan menjelaskan model privasinya akan menjadi penting untuk mendapat kepercayaan pengguna dalam ruang yang kompetitif ini.
Rujukan: Whispering
