Ciri Kongsi ChatGPT Mendedahkan Lebih 100,000 Perbualan Peribadi kepada Enjin Carian

Pasukan Komuniti BigGo

Ciri Kongsi ChatGPT Mendedahkan Lebih 100,000 Perbualan Peribadi kepada Enjin Carian

Butang Kongsi yang kelihatan tidak berbahaya dalam ChatGPT telah bertukar menjadi insiden privasi yang besar, mendedahkan lebih 100,000 perbualan peribadi kepada enjin carian awam. Ciri tersebut, yang direka untuk membolehkan pengguna berkongsi perbualan AI mereka dengan orang lain, mengandungi kotak tanda kecil yang tidak difahami sepenuhnya oleh ramai pengguna - menyebabkan maklumat peribadi, rancangan perniagaan, dan dokumen sensitif menjadi boleh dicari di Google.

Skala Insiden:

Lebih 100,000 perbualan ChatGPT boleh diakses secara terbuka
Perbualan tersebut termasuk resume, pelan perniagaan, kunci API, dan maklumat peribadi
Kandungan telah diindeks oleh Google dan diarkibkan oleh Internet Archive
Sesetengah perbualan masih boleh ditemui di enjin carian alternatif seperti DuckDuckGo


Graf yang menggambarkan turun naik trafik organik, mencerminkan keterlihatan perbualan ChatGPT yang dikongsi selepas insiden

Kotak Tanda Yang Mengubah Segalanya

Punca masalah terletak pada elemen antara muka yang mudah: kotak tanda berlabel Jadikan sembang ini boleh ditemui dengan penjelasan Membolehkannya ditunjukkan dalam carian web. Walaupun ini mungkin kelihatan jelas kepada pengguna yang mahir teknologi, perbincangan komuniti mendedahkan realiti yang lebih kompleks. Ramai pengguna mentafsirkan carian web sebagai merujuk kepada fungsi carian dalaman ChatGPT, tidak menyedari perbualan mereka akan muncul dalam hasil Google bersama resume, kunci API, dan pengakuan yang sangat peribadi.

Perdebatan mengenai reka bentuk antara muka pengguna telah menjadi sangat hangat, dengan sesetengah pihak berhujah bahawa bahasa tersebut cukup jelas, manakala yang lain menunjukkan bahawa dengan lebih satu bilion pengguna ChatGPT, platform tersebut perlu mengambil kira tahap celik teknologi yang berbeza-beza. Istilah boleh ditemui itu sendiri telah dikritik sebagai jargon dalaman yang tidak menyampaikan akibat dengan jelas kepada pengguna biasa.

Masalah Arkeologi Digital

Walaupun OpenAI dengan pantas bertindak balas dengan menambah tag teknikal untuk menghalang pengindeksan enjin carian dan meminta Google mengeluarkan pautan tersebut, kerosakan telah tersebar di luar kawalan mereka. Internet Archive telah menangkap lebih 100,000 perbualan yang dikongsi ini, mewujudkan rekod kekal yang kekal boleh diakses walaupun selepas hasil carian asal hilang.

Apa yang menjadikan situasi ini amat membimbangkan ialah OpenAI tidak meminta pengeluaran perbualan yang diarkibkan ini. Pengguna yang menyangka mereka hanya berkongsi pautan dengan kawan kini mendapati perbincangan peribadi mereka dipelihara selama-lamanya dalam arkib digital, tanpa laluan yang jelas untuk pengeluaran.

Pada satu ketika, saya tidak berasa bersalah mengatakan ini adalah PEBKAC di pihak pengguna, dan lebih banyak amaran akan menjadi pembaziran masa.

Garis Masa Tindak Balas OpenAI:

Menambah tag meta noindex dan nofollow pada halaman perkongsian sembang
Meminta Google untuk membuang pautan berindeks daripada hasil carian
Membuang ciri "boleh ditemui" sepenuhnya
Mengemaskini fail robots.txt (walaupun URL /share/* secara teknikal masih boleh diakses)
Belum diminta: Pembuangan perbualan yang diarkibkan daripada Internet Archive


Fail robotstxt yang memperincikan peraturan laman web untuk perangkak web, berkaitan dengan pengindeksan perbualan ChatGPT yang dikongsi

Gambaran Besar Persetujuan Digital

Insiden ini menyerlahkan cabaran asas dalam reka bentuk perisian moden: bagaimana untuk memaklumkan pengguna dengan betul tentang akibat jangka panjang tindakan mereka. Perbincangan komuniti mendedahkan bahawa sesetengah enjin carian seperti DuckDuckGo masih menunjukkan pautan yang dikongsi ini, dan banyak mengandungi maklumat sensitif termasuk dokumen kewangan, perbincangan kesihatan, dan resume lengkap dengan maklumat hubungan peribadi.

Kontroversi ini telah mencetuskan persoalan yang lebih luas tentang persetujuan digital dan tanggungjawab platform. Patutkah syarikat seperti OpenAI memikul lebih tanggungjawab untuk melindungi pengguna yang tidak memahami sepenuhnya implikasi ciri perkongsian? Atau patutkah pengguna dijangka memahami bahawa apa-apa yang diterbitkan di web berpotensi menjadi kekal dan boleh dicari?

Komuniti teknikal kekal berpecah, dengan sesetengah pihak menyeru lebih geseran dalam ciri perkongsian - mungkin memerlukan pengesahan berganda atau amaran yang lebih jelas tentang keterlihatan kekal. Yang lain berhujah bahawa tiada jumlah penambahbaikan antara muka boleh melindungi pengguna yang tidak membaca dengan teliti atau memahami konsep web asas.

Insiden ini berfungsi sebagai peringatan bahawa dalam tergesa-gesa kita untuk menjadikan alat AI boleh diakses oleh semua orang, kita mesti mempertimbangkan dengan teliti bagaimana keputusan reka bentuk antara muka boleh membawa akibat yang berkekalan untuk privasi pengguna. Internet, seperti yang dipelajari ramai dengan cara yang sukar, jarang lupa.

Rujukan: ChatGPT Chats Were Indexed Then Removed From Search but Still Remain Online