Google secara senyap-senyap menghapuskan ciri carian yang membolehkan pengguna melihat 100 hasil dalam satu halaman, mengehadkan paparan kepada hanya 10 hasil sahaja. Walaupun ini mungkin kelihatan seperti perubahan antara muka yang kecil, ia telah mencetuskan perbincangan yang ketara dalam komuniti teknologi mengenai kesannya terhadap sistem AI dan keterlihatan laman web.
Penghapusan parameter num=100 telah menimbulkan persoalan tentang bagaimana syarikat AI mengumpul data latihan dan sama ada mereka sepatutnya bergantung pada hasil carian Google pada mulanya. Ramai ahli komuniti melihat ini sebagai langkah yang dijangka dan bukannya perkembangan yang mengejutkan.
Had Keputusan Carian:
- Had sebelumnya: 100 keputusan setiap halaman melalui parameter num=100
- Had baharu: 10 keputusan setiap halaman (had keras)
- Kesan: 86% daripada laman web mengalami penurunan tayangan menurut Search Engine Land
Penyelesaian Teknikal Sudah Wujud
Komuniti teknologi dengan pantas menunjukkan bahawa penyelesaian alternatif sudah tersedia. Common Crawl , repositori terbuka data web, menyediakan satu alternatif sedemikian untuk syarikat yang mencari kandungan web yang komprehensif. Beberapa pembangun menyatakan bahawa membina perangkak web tersuai tidaklah begitu kompleks, mencadangkan bahawa syarikat AI berkemungkinan akan membangunkan sistem carian mereka sendiri dalam beberapa bulan.
Walau bagaimanapun, perbincangan mendedahkan bahawa perangkakan dan pengindeksan memberikan cabaran yang berbeza. Walaupun merangkak halaman web adalah mudah, mencipta sistem penarafan yang berkesan kekal sebagai kekuatan teras Google . Sesetengah ahli komuniti mempersoalkan sama ada penarafan ini penting untuk sistem AI dengan tetingkap konteks yang besar berbanding pengguna manusia yang melayari hasil carian.
Mempersoalkan Dakwaan Asal
Perbincangan komuniti mencabar beberapa andaian dalam laporan asal. Ramai pengguna menunjukkan bahawa syarikat AI utama seperti OpenAI menggunakan Bing untuk fungsi carian, manakala Claude dilaporkan menggunakan Brave Search . Ini menunjukkan bahawa kesan terhadap saluran latihan AI mungkin kurang teruk daripada yang didakwa pada mulanya.
Saya fikir OpenAI menggunakan Bing . Gemini jelas akan menggunakan Google tetapi kepada mereka sekatan itu tidak terpakai. Claude mengatakan ia menggunakan Brave .
Komuniti juga menyatakan bahawa vendor AI utama biasanya mengendalikan sistem perangkakan mereka sendiri dan bukannya bergantung pada antara muka carian Google , menjadikan penghapusan parameter kurang ketara untuk pemain yang sudah mantap.
Sumber Data Alternatif untuk Syarikat AI:
- Common Crawl : Repositori merangkak web terbuka
- Bing Search API : Digunakan oleh OpenAI
- Brave Search : Digunakan oleh Claude / Anthropic
- Perangkak tersuai: OAI-SearchBot , GPTBot untuk latihan OpenAI
Peluang Pasaran Muncul
Perubahan ini telah mencipta peluang perniagaan yang berpotensi untuk pakar teknologi carian. Bekas jurutera carian Google dan pakar serupa boleh memanfaatkan permintaan yang semakin meningkat untuk infrastruktur carian bebas ketika syarikat AI mencari alternatif kepada ekosistem Google .
Perbincangan menyerlahkan bahawa walaupun algoritma penarafan Google mengambil masa bertahun-tahun untuk dibangunkan, teknologi asas untuk perangkakan dan pengindeksan difahami dengan baik. Ini menunjukkan bahawa syarikat yang berdeterminasi dengan sumber yang mencukupi boleh membina alternatif yang kompetitif, walaupun mereplikasi keupayaan autoriti dan pengecaman corak Google memerlukan pelaburan yang ketara.
Respons komuniti menunjukkan bahawa walaupun langkah Google menjejaskan sesetengah sistem, industri teknologi sudah menyesuaikan diri dengan pendekatan dan penyelesaian alternatif.
Rujukan: Google just cut off 90% of the internet from AI - no one's talking about it