Google Secara Senyap Menaikkan Harga Gemini 2.5 Flash Sehingga 4 Kali Ganda Sambil Mengumumkan Model Flash-Lite Baharu

Pasukan Editorial BigGo

Google Secara Senyap Menaikkan Harga Gemini 2.5 Flash Sehingga 4 Kali Ganda Sambil Mengumumkan Model Flash-Lite Baharu

Google telah menjadikan model Gemini 2.5 Flash dan Pro tersedia secara umum sambil memperkenalkan varian Flash-Lite yang baharu. Walau bagaimanapun, pengumuman ini telah mencetuskan perbincangan yang ketara dalam komuniti pembangun disebabkan kenaikan harga yang besar yang tidak ditonjolkan dengan jelas dalam catatan blog rasmi.

Kenaikan Harga Tersembunyi Mengejutkan Pembangun

Peralihan daripada pratonton kepada keluaran stabil membawa perubahan harga yang dramatik untuk Gemini 2.5 Flash. Kos input meningkat dua kali ganda daripada $0.15 kepada $0.30 dolar Amerika Syarikat setiap juta token, manakala harga output melonjak daripada $0.60 kepada $2.50 dolar Amerika Syarikat setiap juta token untuk mod bukan pemikiran - peningkatan 4 kali ganda. Komuniti telah mengkritik Google kerana memperkecilkan perubahan ini, dengan catatan blog hanya menyebut pengurangan daripada $3.50 kepada $2.50 dolar Amerika Syarikat untuk output mod pemikiran.

Berita sebenar ialah output bukan pemikiran kini 4 kali ganda lebih mahal, yang sudah tentu mereka elakkan daripada menyebut dalam blog, hanya membandingkan harga pemikiran sahaja.

Strategi harga ini mempengaruhi pembangun yang membina aplikasi semasa tempoh pratonton, terutamanya mereka yang menggunakan mod bukan pemikiran untuk tugas sensitif kelajuan seperti AI suara atau aplikasi masa nyata.

Perubahan Harga Gemini 2.5 Flash

Metrik	Harga Pratonton	Harga Stabil Baharu	Peningkatan
Token input	$0.15/juta	$0.30/juta	2x
Output (bukan pemikiran)	$0.60/juta	$2.50/juta	4.2x
Output (pemikiran)	$3.50/juta	$2.50/juta	0.7x (penurunan)
Token audio	$1.00/juta	$1.00/juta	Tiada perubahan

Flash-Lite Muncul sebagai Alternatif Bajet

Google memperkenalkan Gemini 2.5 Flash-Lite sebagai pilihan yang paling kos efektif, diposisikan untuk bersaing dengan model 2.0 Flash yang lebih lama. Varian baharu ini mengekalkan tetingkap konteks 1 juta token dan keupayaan multimodal sambil menawarkan masa respons yang lebih pantas, selalunya di bawah 400ms. Walau bagaimanapun, ujian awal menunjukkan ia mungkin tidak sepadan dengan prestasi model Flash penuh untuk tugas yang kompleks.

Kos pemprosesan audio juga telah meningkat dengan ketara di seluruh papan, dengan Flash-Lite mengenakan caj $0.50 dolar Amerika Syarikat setiap juta token berbanding Flash-Lite 2.0 sebelumnya sebanyak $0.075 dolar Amerika Syarikat - mewakili lonjakan harga 6.3 kali ganda.

Ciri-ciri Utama Gemini 2.5 Flash-Lite

Tetingkap Konteks: 1 juta token
Masa Respons: Biasanya di bawah 400ms, serendah 200ms
Keupayaan: Input multimodal, integrasi Google Search , pelaksanaan kod
Mod Pemikiran: Tersedia dengan bajet yang boleh dilaraskan
Kedudukan: Model paling kos-efisien dalam keluarga 2.5

Reaksi Komuniti Berpecah mengenai Kualiti Model

Maklum balas pembangun mengenai kemas kini terkini Gemini menunjukkan hasil yang bercampur-campur. Walaupun sesetengah pengguna memuji prestasi pengekodan yang bertambah baik dan tetingkap konteks yang besar, yang lain melaporkan kemerosotan kualiti berbanding versi pratonton yang lebih awal. Beberapa pembangun telah mencatatkan isu dengan respons yang bertele-tele, komen berlebihan dalam kod yang dijana, dan prestasi yang tidak konsisten.

Sistem pengehadan kadar juga telah menarik kritikan, dengan sesetengah pengguna tidak dapat mencapai peringkat perbelanjaan yang lebih tinggi disebabkan had permintaan yang ketat, memaksa mereka kembali kepada pesaing seperti OpenAI walaupun lebih suka keupayaan teknikal Gemini.

Perbandingan Harga Pemprosesan Audio

Model	Harga per Juta Token
Gemini 2.0 Flash-Lite	$0.075
Gemini 2.5 Flash-Lite	$0.50
Kenaikan Harga	6.3x

Harga Strategik Mencerminkan Kematangan Pasaran

Kenaikan harga sejajar dengan trend industri yang lebih luas ketika syarikat AI beralih daripada pemerolehan pelanggan yang agresif kepada model perniagaan yang mampan. Harga rendah awal Google membantu mewujudkan kehadiran pasaran, tetapi syarikat kini nampaknya cukup yakin untuk mengenakan kadar pasaran. Peralihan ini mencerminkan landskap AI yang semakin matang di mana penyedia menyeimbangkan peningkatan prestasi dengan tuntutan keuntungan.

Perubahan ini menyerlahkan cabaran berterusan untuk pembangun yang membina pada model pratonton, di mana kestabilan harga tidak dijamin sehingga ketersediaan umum. Ketika pasaran AI terus berkembang, syarikat mesti menimbang faedah keupayaan canggih berbanding risiko kos dan syarat yang berubah-ubah.

Rujukan: We're expanding our Gemini 2.5 family of models