Tajuk Berita Pelanggaran 16 Bilion Kata Laluan Mengelirukan Orang Ramai Kerana Analisis Mendedahkan Pengurangan Data 96%

Pasukan Komuniti BigGo

Tajuk Berita Pelanggaran 16 Bilion Kata Laluan Mengelirukan Orang Ramai Kerana Analisis Mendedahkan Pengurangan Data 96%

Dunia keselamatan siber gempar pada bulan Jun 2024 apabila tajuk berita memekik tentang pelanggaran kata laluan yang memecahkan rekod sebanyak 16 bilion. Berita tersebut mendapat perhatian yang begitu besar sehingga memasuki media arus perdana, dengan penerbitan mengarahkan pengguna yang bimbang untuk memeriksa pangkalan data pelanggaran. Walau bagaimanapun, analisis terperinci terhadap data sebenar mendedahkan jurang yang ketara antara tajuk berita sensasi dan realiti.

Cerita asal bukanlah mengenai satu pelanggaran besar-besaran tunggal langsung. Sebaliknya, ia melibatkan koleksi data pencuri maklumat yang berbeza yang telah didedahkan secara terbuka sepanjang tahun tersebut. Log pencuri ini datang dari komputer individu yang telah dikompromi dan kadangkala digabungkan bersama dan diedarkan semula oleh penjenayah siber.


Ilustrasi troll ini secara lucu mewakili sifat berlebihan tajuk berita pelanggaran kata laluan 16 bilion

Angka-angka Tidak Sepadan

Apabila penyelidik keselamatan meneliti subset data ini - mewakili kira-kira 17% daripada 16 bilion rekod yang dilaporkan - mereka mendapati inflasi yang dramatik dalam tajuk berita. 2.7 bilion baris data yang mereka analisis mengandungi pendua besar-besaran merentasi fail yang berbeza dan dalam fail yang sama. Selepas membuang pendua dan menganalisis entri yang sah, angka-angka menyusut secara dramatik.

Analisis mendedahkan bahawa 2.7 bilion baris akhirnya mewakili hanya 109 juta alamat e-mel unik - pengurangan yang mengejutkan sebanyak 96% daripada data mentah kepada orang sebenar yang terjejas. Corak ini menunjukkan angka penuh 16 bilion berkemungkinan akan mengalami pengurangan yang lebih besar lagi apabila dianalisis dengan betul.

Terdapat ~335 juta rakyat Amerika . Pelanggaran data semua kunci SIM pengguna AS akan jauh lebih bencana daripada apa-apa yang pernah kita lihat dalam keselamatan komputer, walaupun bersaiz separuh daripada yang ini.

Analisis Pengurangan Data:

Set data asal: 2.7 bilion baris
Entri log pencuri unik: 325 juta (selepas penghuraian)
Alamat emel unik: 109 juta
Pengurangan keseluruhan: 96% daripada data mentah kepada orang sebenar
Alamat emel baharu ditambah: 4.4 juta
Kata laluan unik ditemui: 55 juta (96% telah diketahui sebelum ini)


Graf ini menggambarkan turun naik minat orang ramai yang berkaitan dengan tajuk utama pelanggaran keselamatan yang disensasikan dari semasa ke semasa

Mengapa Tajuk Berita Melambungkan Nombor Pelanggaran

Perbincangan komuniti menyerlahkan beberapa sebab mengapa nombor pelanggaran data menjadi begitu melambung. Setiap baris dalam set data ini biasanya mewakili satu kejadian kelayakan seseorang ditangkap di laman web tertentu. Jadi jika butiran log masuk seseorang dicuri daripada kedua-dua Netflix dan Spotify , itu akan dikira sebagai dua baris berasingan dalam set data.

Selain itu, orang yang sama mungkin muncul berpuluh kali merentasi pelanggaran berbeza selama bertahun-tahun. Dengan beratus-ratus pelanggaran data utama berlaku dalam dua dekad yang lalu, dan orang mengekalkan akaun merentasi pelbagai platform, mudah untuk melihat bagaimana nombor mentah boleh mengembang kepada berbilion sambil mewakili individu sebenar yang jauh lebih sedikit.

Faktor Utama Di Sebalik Angka Yang Melambung:

Pertindihan merentas pelbagai fail
Pertindihan dalam fail yang sama
Pelbagai entri bagi setiap individu (satu bagi setiap laman web/perkhidmatan)
Data yang dibungkus semula daripada pelanggaran terdahulu
Data bersejarah yang merangkumi beberapa tahun

Kesan Sebenar

Walaupun tajuk berita yang melambung, pelanggaran itu masih mempunyai kepentingan yang tulen. Analisis menambah 4.4 juta alamat e-mel yang tidak diketahui sebelum ini ke pangkalan data pelanggaran, bersama dengan 55 juta kata laluan unik. Walau bagaimanapun, 96% daripada kedua-dua alamat e-mel dan kata laluan telah dilihat dalam pelanggaran sebelumnya, menunjukkan kebanyakan ini adalah data kitar semula dan bukannya pendedahan segar.

Komuniti keselamatan menekankan bahawa walaupun pelanggaran ini harus diambil serius, tajuk berita hiperbola mencipta panik yang tidak perlu. Data sebahagian besarnya terdiri daripada log pencuri lama yang telah beredar untuk beberapa lama, dan bukannya mewakili ancaman baru dan segera kepada keselamatan pengguna.

Kes ini berfungsi sebagai peringatan untuk mendekati tajuk berita keselamatan siber sensasi dengan skeptisisme yang sihat dan menunggu analisis teknikal yang betul sebelum membuat kesimpulan tentang skop sebenar mana-mana pelanggaran data.

Rujukan: That 16 Billion Password Story (AKA Data Troll)