Model bahasa besar terbaharu Google, Gemini 3, telah menjana minat pengguna yang begitu hebat sejak dilancarkan awal bulan ini sehingga syarikat itu terpaksa mengurangkan akses untuk pengguna peringkat percuma. Lonjakan permintaan ini berlaku seiring dengan transformasi dalaman yang signifikan di Google, di mana pengakuan jujur tentang ketinggalan dalam perlumbaan AI telah mencetuskan perubahan menyeluruh dalam strategi pembangunan dan pelaksanaannya, meletakkan Gemini bukan sekadar sebagai ejen perbualan tetapi sebagai asas untuk generasi baharu AI yang boleh bertindak.
Mengakui Permainan Mengejar
Perjalanan ke Gemini 3 bermula dengan detik kerendahan hati korporat yang jarang berlaku. Ketua Arkitek AI Google dan CTO DeepMind, Koray Kavukcuoglu, secara terbuka menyatakan bahawa syarikat itu sedar mereka ketinggalan di belakang pesaing. Pengakuan ini bukanlah tanda kekalahan tetapi satu keperluan strategik, yang berfungsi sebagai pemangkin untuk tetapan semula asas. Pendekatan berpusatkan penyelidikan syarikat sebelum ini, walaupun berjaya mencipta projek mercu tanda seperti AlphaGo, terbukti terlalu perlahan untuk lelaran pantas yang diperlukan dalam ruang model bahasa besar yang menghadapi pengguna. Menerima realiti ini adalah langkah pertama yang penting dalam rancangan Google untuk meraih kembali kedudukannya di barisan hadapan AI.
Ubah Suai Seni Bina untuk Dunia Multimodal
Yang teras kepada reka bentuk semula Gemini adalah komitmen mendalam terhadap multimodaliti, bukan sebagai ciri tambahan tetapi sebagai prinsip seni bina teras. Kavukcuoglu menerangkan bahawa kepintaran tidak boleh linear kerana dunia yang ingin difahaminya tidak linear. Model ini dibina dari awal untuk memproses teks, imej, audio dan video bersama-sama dalam satu sistem. Ini melibatkan alatan semula lengkap bagi kaedah tokenisasi, kerugian latihan dan laluan pengoptimuman. Hasilnya adalah model yang cemerlang dalam tugas kompleks dan rentas modal seperti pemahaman dokumen dan penghuraian carta, melangkaui metrik mudah kualiti penjanaan imej kepada pemahaman yang lebih mendalam dan bersepadu.
Penstrukturan Semula Organisasi untuk Kelajuan
Mungkin perubahan paling signifikan di sebalik kemajuan pantas Gemini adalah penulisan semula lengkap metodologi organisasi Google. Syarikat itu merombak saluran bersiri tradisionalnya, di mana pasukan penyelidikan, kejuruteraan, produk dan keselamatan bekerja secara berurutan. Untuk Gemini 3, kumpulan ini disusun semula menjadi sistem selari. Pengurus produk terlibat dari hari pertama latihan, jurutera mengoptimumkan untuk pelaksanaan secara serentak, dan protokol keselamatan disematkan sepanjang proses. Pemecahan daripada operasi tersorok ini membolehkan Google mempercepatkan kitaran lelarannya secara mendadak, akhirnya menyamai kadar pesaingnya dan menghasilkan model yang stabil dan boleh digunakan dalam senario dunia sebenar.
Permintaan Melampau Memberatkan Akses Percuma
Kejayaan pivot strategik ini jelas dalam sambutan pengguna yang luar biasa. Permintaan untuk Gemini 3 begitu tinggi sehingga Google terpaksa mengurangkan had penggunaan untuk pengguna dalam pelan percumanya. Pada mulanya, akaun percuma mempunyai akses kepada "sehingga 5 carian" sehari untuk model utama Gemini dan "sehingga 3 imej/hari" untuk model penjanaan imejnya, Nano Banano Pro. Disebabkan beban pelayan, had ini kini telah dikurangkan kepada peringkat "Akses Asas" yang lebih berubah-ubah, dengan had harian tertakluk kepada perubahan kerap. Akses Nano Banano Pro untuk pengguna percuma telah dipotong kepada 2 imej sehari. Permintaan tinggi ini juga menyebabkan Google buat sementara waktu menarik balik akses kepada ciri baharu berkuasa Nano Banano Pro dalam NotebookLM untuk pengguna percuma.
Peralihan daripada Bahasa kepada Kepintaran Tindakan
Melihat ke hadapan, Kavukcuoglu merangka peringkat seterusnya persaingan AI bukan sebagai pertempuran untuk perbualan yang lebih baik, tetapi untuk penyiapan tugas yang unggul. Matlamat untuk Gemini adalah untuk berkembang menjadi "sistem pengendalian tugas", mampu mengendalikan aliran kerja berbilang langkah, mengautomasikan alat pembangun dan menggerakkan kepintaran peringkat sistem merentasi Android, Chrome dan Workspace. Wawasan ini menandakan peralihan kritikal daripada AI sebagai produk untuk dialog kepada AI sebagai platform untuk tindakan, satu anjakan yang membawa potensi komersial dan nilai jangka panjang yang jauh lebih besar. Bagi pengguna, ini bermakna penambahbaikan Gemini semakin diukur dengan keupayaannya untuk melaksanakan arahan dan mencapai matlamat, bukan sekadar menjawab soalan.
Infrastruktur sebagai Kelebihan Tersembunyi
Walaupun keupayaan model mencuri tumpuan, Kavukcuoglu menekankan bahawa kelebihan daya saing sebenar Google terletak pada infrastrukturnya. Rangkaian global TPU, pusat data dan rangka kerja keselamatannya yang matang, apabila digabungkan dengan kuasa pengedaran produk seperti Search dan Android, mencipta kesan rangkaian yang sukar untuk direplikasi. Pelaksanaan pantas Gemini merentasi keseluruhan matriks produk Google pada hari pelancaran adalah bukti kepada kekuatan ini. Cabaran penskalaan semasa, walaupun menyusahkan untuk pengguna percuma, juga menyerlahkan infrastruktur besar-besaran yang diperlukan untuk menyokong model berkualiti ini pada skala global. Google menjangkakan bahawa dengan puncak musim percutian AS dan Krismas hanya beberapa minggu lagi, beban pelayan mungkin kekal tinggi sehingga awal Januari, di mana had asal mungkin boleh dipulihkan.
