Implan Otak Menukar Fikiran kepada Pertuturan Secara Masa Nyata, Tetapi Ketepatan Masih Menjadi Cabaran

Pasukan Komuniti BigGo
Implan Otak Menukar Fikiran kepada Pertuturan Secara Masa Nyata, Tetapi Ketepatan Masih Menjadi Cabaran

Saintis di UC Davis telah membangunkan implan otak terobosan yang boleh menterjemahkan isyarat neural secara langsung kepada bunyi pertuturan dalam masa nyata. Ini mewakili lonjakan besar ke hadapan daripada sistem terdahulu yang hanya boleh menukar fikiran kepada teks di skrin. Teknologi ini menawarkan harapan baru untuk orang yang menghidap keadaan seperti ALS yang telah kehilangan keupayaan untuk bertutur dengan jelas.

Penjanaan Bunyi Masa Nyata Tanpa Had Kamus

Tidak seperti antara muka komputer-otak terdahulu yang bergantung pada senarai perkataan yang telah ditetapkan, sistem baru ini menukar isyarat otak kepada bunyi dan fonem sebenar. Ini bermakna pengguna boleh mengatakan apa sahaja yang mereka mahu, termasuk perkataan rekaan, kata seru seperti um dan hmm, dan bahkan menyanyikan melodi pendek. Sistem ini berfungsi dengan latensi yang sangat rendah iaitu hanya 10 milisaat, menjadikan penukaran daripada fikiran kepada pertuturan pada dasarnya serta-merta.

Terobosan ini datang daripada menyasarkan kawasan pengeluaran pertuturan otak dan bukannya hanya kawasan kawalan motor. Penyelidik menanam 256 mikroelektrod ke dalam ventral precentral gyrus pesakit, yang mengawal otot saluran vokal. Penyahkod AI kemudian mengekstrak ciri pertuturan seperti nada dan penyuaraan daripada isyarat neural, menyuapkannya ke dalam vokoder yang mencipta semula suara asal pesakit.

Spesifikasi Teknikal

  • Elektrod: 256 mikroelektrod yang diimplan dalam gyrus precentral ventral
  • Latensi: ~10 milisaat (hampir serta-merta)
  • Pemprosesan Isyarat: Penyahkod neural AI + vocoder untuk sintesis pertuturan
  • Perbendaharaan Kata: Tidak terhad (tiada kekangan kamus)
  • Ciri-ciri: Menyokong nada, prosodi, kata seru, dan melodi asas

Isu Ketepatan Mengehadkan Penggunaan Praktikal

Walaupun teknologi ini menunjukkan potensi, cabaran besar masih wujud. Dalam ujian terkawal di mana pendengar memilih daripada enam ayat yang serupa, sistem mencapai ketepatan 100% yang sempurna. Walau bagaimanapun, dalam ujian transkripsi terbuka yang lebih mencerminkan perbualan sebenar, kadar ralat perkataan melonjak kepada 43.75%. Ini bermakna pendengar hanya boleh mengenal pasti dengan betul kira-kira separuh daripada perkataan yang dituturkan.

Kami belum berada di tahap di mana ia boleh digunakan dalam perbualan terbuka. Saya menganggap ini sebagai bukti konsep.

Sebagai perbandingan, pertuturan semula jadi pesakit tanpa peranti mempunyai kadar ralat 96.43% dalam ujian yang sama, menunjukkan implan memang memberikan penambahbaikan yang besar. Namun, ketepatan semasa masih kurang daripada apa yang diperlukan untuk komunikasi harian.

Perbandingan Prestasi Sistem

Jenis Ujian Ketepatan Implan Otak Ketepatan Pertuturan Semula Jadi
Terkawal (pilihan 6 ayat) 100% Tidak diuji
Transkripsi terbuka 56.25% betul 3.57% betul
Kadar ralat perkataan 43.75% 96.43%

Kebimbangan Privasi dan Kawalan

Teknologi ini menimbulkan persoalan penting tentang privasi mental dan kawalan. Perbincangan komuniti menyerlahkan kebimbangan tentang sama ada peranti mungkin secara tidak sengaja menyiarkan fikiran dalaman yang tidak dimaksudkan untuk dituturkan dengan kuat. Walau bagaimanapun, pakar menjelaskan bahawa sistem memerlukan pengaktifan yang disengajakan dan memfokuskan pada kawasan pengeluaran pertuturan dan bukannya kawasan pemprosesan fikiran umum.

Kebolehsuaian otak yang luar biasa menunjukkan pengguna boleh belajar mengawal bila peranti diaktifkan, sama seperti bagaimana kita boleh berfikir tentang menggerakkan lengan kita tanpa benar-benar melakukannya. Proses pembelajaran ini mungkin melibatkan pembangunan laluan neural baru untuk memisahkan fikiran peribadi daripada pertuturan yang dimaksudkan.

Ujian Klinikal Yang Akan Datang

  • Syarikat: Paradromics ( Austin, Texas )
  • Bilangan Elektrod: 1,600 elektrod (berbanding 256 semasa)
  • Lokasi: UC Davis
  • Status: Sedang memohon kelulusan FDA
  • Ketua Penyelidik: David Brandman (pengarang bersama kajian semasa)

Penambahbaikan Masa Depan dan Ujian Klinikal

Penyelidik percaya kunci kepada ketepatan yang lebih baik terletak pada penggunaan lebih banyak elektrod. Sistem semasa menggunakan sekitar 250 elektrod, tetapi syarikat permulaan baru sedang membangunkan peranti dengan lebih daripada 1,000 elektrod. Paradromics , sebuah syarikat yang berpangkalan di Texas , merancang untuk menguji sistem 1,600 elektrod dalam ujian klinikal yang diluluskan FDA yang akan datang di UC Davis .

Teknologi ini mewakili langkah penting ke arah memberi orang yang mengalami lumpuh teruk cara yang lebih semula jadi untuk berkomunikasi. Walaupun belum bersedia untuk kegunaan harian, ia menunjukkan bahawa penukaran langsung otak-ke-pertuturan adalah mungkin dan akhirnya boleh memulihkan ekspresi penuh suara manusia kepada mereka yang telah kehilangannya.

Rujukan: A neural brain implant provides near instantaneous speech