Sambungan Pelayar Claude Dilancarkan dengan Kadar Kejayaan Serangan 11% Walaupun Ada Langkah Keselamatan

Pasukan Komuniti BigGo
Sambungan Pelayar Claude Dilancarkan dengan Kadar Kejayaan Serangan 11% Walaupun Ada Langkah Keselamatan

Anthropic telah melancarkan perintis terhad bagi Claude untuk Chrome , sambungan pelayar yang membolehkan pembantu AI mengambil tindakan bagi pihak pengguna. Walau bagaimanapun, pelancaran ini datang dengan kebimbangan keselamatan yang ketara yang telah mencetuskan perdebatan sengit dalam komuniti teknologi.

Sambungan ini, yang kini tersedia kepada hanya 1,000 pengguna, mewakili langkah besar ke arah ejen AI yang boleh berinteraksi secara langsung dengan halaman web. Claude boleh mengklik butang, mengisi borang, mengurus kalendar, dan mengendalikan tugas rutin seperti laporan perbelanjaan. Tetapi kemudahan ini datang dengan harga yang tinggi dari segi kelemahan keselamatan.

Skop Ujian:

  • 135 kes ujian dinilai
  • 10 senario serangan berbeza diuji
  • 1,000 pengguna pelan Max dalam pilot awal
  • 4 jenis serangan khusus pelayar dalam set cabaran
Memperkenalkan Claude untuk Chrome: Sambungan pelayar AI baharu yang direka untuk membantu aktiviti dalam talian pengguna
Memperkenalkan Claude untuk Chrome: Sambungan pelayar AI baharu yang direka untuk membantu aktiviti dalam talian pengguna

Serangan Suntikan Gesaan Kekal Sebagai Ancaman Utama

Walaupun melaksanakan pelbagai langkah keselamatan, ujian Anthropic sendiri mendedahkan bahawa sistem masih mempunyai kadar kejayaan serangan 11.2% terhadap serangan suntikan gesaan. Serangan ini berlaku apabila pelaku berniat jahat menyembunyikan arahan dalam laman web, e-mel, atau dokumen yang memperdaya AI untuk melakukan tindakan berbahaya tanpa pengetahuan pengguna.

Syarikat menjalankan ujian meluas dengan 135 kes ujian merentasi 10 senario serangan yang berbeza. Sebelum melaksanakan langkah keselamatan, kadar kejayaan serangan adalah 23.6% yang mengejutkan. Walaupun penambahbaikan adalah ketara, kadar kegagalan 11% bermakna kira-kira satu daripada sembilan serangan yang disasarkan masih boleh berjaya.

Satu contoh yang dikongsi Anthropic melibatkan e-mel berniat jahat yang mendakwa bahawa atas sebab keselamatan, e-mel perlu dipadamkan. AI mengikuti arahan tersembunyi ini dan memadamkan e-mel pengguna tanpa pengesahan. Walaupun pertahanan semasa mereka kini boleh mengenali percubaan pancingan data yang jelas seperti itu, serangan yang lebih canggih kekal menjadi kebimbangan.

Kadar Kejayaan Serangan:

  • Sebelum mitigasi keselamatan: 23.6%
  • Selepas mitigasi keselamatan: 11.2%
  • Serangan khusus pelayar web (set cabaran): Berkurang daripada 33.7% kepada 0%

Komuniti Membangkitkan Kebimbangan Privasi dan Keselamatan yang Serius

Komuniti teknologi telah bertindak balas dengan skeptisisme yang ketara mengenai implikasi keselamatan. Ramai pembangun dan pakar keselamatan mempersoalkan sama ada faedah membenarkan risiko, terutamanya memandangkan pengguna pada dasarnya akan memberikan sistem AI akses luas kepada aktiviti pelayaran dan data peribadi mereka.

Adalah lebih selamat meninggalkan kad kredit anda terbaring dengan PIN terukir padanya daripada menggunakan alat ini.

Kebimbangan melangkaui serangan suntikan gesaan sahaja. Pengguna bimbang tentang implikasi privasi, kerana sambungan akan mempunyai akses kepada sejarah pelayaran dan kandungan merentasi semua laman web. Terdapat juga kebimbangan tentang potensi serangan yang lebih canggih yang belum ditemui lagi.

Amaran Insiden Keselamatan: Pengguna digesa untuk mengambil tindakan segera bagi melindungi data e-mel mereka, menyerlahkan kebimbangan privasi
Amaran Insiden Keselamatan: Pengguna digesa untuk mengambil tindakan segera bagi melindungi data e-mel mereka, menyerlahkan kebimbangan privasi

Had Teknikal Menghalang Prestasi Dunia Sebenar

Selain isu keselamatan, pembangun yang telah bereksperimen dengan alat automasi pelayar serupa melaporkan had teknikal yang ketara. Ramai menyatakan bahawa model AI dengan cepat kehilangan konteks apabila melakukan tugas berbilang langkah yang kompleks dalam pelayar. Kepadatan maklumat visual dan kontekstual halaman web nampaknya mencabar untuk model bahasa semasa memproses dengan berkesan.

Beberapa ahli komuniti berkongsi pengalaman di mana ejen pelayar AI akan berfungsi untuk beberapa lelaran sebelum menjadi keliru atau mengisytiharkan tugas selesai secara pramatang. Ini menunjukkan bahawa walaupun teknologi menunjukkan janji, ia mungkin tidak bersedia untuk penggunaan dunia sebenar yang boleh dipercayai.

Ciri Keselamatan Semasa:

  • Kebenaran peringkat tapak (pengguna boleh memberikan/menarik balik akses)
  • Pengesahan tindakan untuk operasi berisiko tinggi
  • Penyekatan kategori laman web berisiko tinggi (kewangan, kandungan dewasa, kandungan cetak rompak)
  • Pengelas lanjutan untuk mengesan corak arahan yang mencurigakan
  • Penambahbaikan gesaan sistem untuk mengendalikan data sensitif

Kesimpulan

Pendekatan berhati-hati Anthropic dengan perintis terhad 1,000 pengguna menunjukkan kesedaran tentang risiko yang terlibat. Walau bagaimanapun, kadar kejayaan serangan 11% dan kebimbangan keselamatan yang lebih luas menimbulkan persoalan sama ada ejen AI yang mengawal pelayar bersedia untuk penggunaan arus perdana. Syarikat merancang untuk secara beransur-ansur mengembangkan akses sambil mereka membangunkan langkah keselamatan yang lebih kuat, tetapi cabaran asas suntikan gesaan dan kebolehpercayaan AI dalam persekitaran web yang kompleks kekal sebagai halangan yang ketara untuk diatasi.

Suntikan gesaan: Sejenis serangan siber di mana arahan berniat jahat disembunyikan dalam kandungan untuk memanipulasi sistem AI supaya melakukan tindakan yang tidak diingini.

Rujukan: Piloting Claude for Chrome