Google telah menjadikan model Gemini 2.5 Flash dan Pro tersedia secara umum sambil memperkenalkan varian Flash-Lite yang baharu. Walau bagaimanapun, pengumuman ini telah mencetuskan perbincangan yang ketara dalam komuniti pembangun disebabkan kenaikan harga yang besar yang tidak ditonjolkan dengan jelas dalam catatan blog rasmi.
Kenaikan Harga Tersembunyi Mengejutkan Pembangun
Peralihan daripada pratonton kepada keluaran stabil membawa perubahan harga yang dramatik untuk Gemini 2.5 Flash. Kos input meningkat dua kali ganda daripada $0.15 kepada $0.30 dolar Amerika Syarikat setiap juta token, manakala harga output melonjak daripada $0.60 kepada $2.50 dolar Amerika Syarikat setiap juta token untuk mod bukan pemikiran - peningkatan 4 kali ganda. Komuniti telah mengkritik Google kerana memperkecilkan perubahan ini, dengan catatan blog hanya menyebut pengurangan daripada $3.50 kepada $2.50 dolar Amerika Syarikat untuk output mod pemikiran.
Berita sebenar ialah output bukan pemikiran kini 4 kali ganda lebih mahal, yang sudah tentu mereka elakkan daripada menyebut dalam blog, hanya membandingkan harga pemikiran sahaja.
Strategi harga ini mempengaruhi pembangun yang membina aplikasi semasa tempoh pratonton, terutamanya mereka yang menggunakan mod bukan pemikiran untuk tugas sensitif kelajuan seperti AI suara atau aplikasi masa nyata.
Perubahan Harga Gemini 2.5 Flash
Metrik | Harga Pratonton | Harga Stabil Baharu | Peningkatan |
---|---|---|---|
Token input | $0.15/juta | $0.30/juta | 2x |
Output (bukan pemikiran) | $0.60/juta | $2.50/juta | 4.2x |
Output (pemikiran) | $3.50/juta | $2.50/juta | 0.7x (penurunan) |
Token audio | $1.00/juta | $1.00/juta | Tiada perubahan |
Flash-Lite Muncul sebagai Alternatif Bajet
Google memperkenalkan Gemini 2.5 Flash-Lite sebagai pilihan yang paling kos efektif, diposisikan untuk bersaing dengan model 2.0 Flash yang lebih lama. Varian baharu ini mengekalkan tetingkap konteks 1 juta token dan keupayaan multimodal sambil menawarkan masa respons yang lebih pantas, selalunya di bawah 400ms. Walau bagaimanapun, ujian awal menunjukkan ia mungkin tidak sepadan dengan prestasi model Flash penuh untuk tugas yang kompleks.
Kos pemprosesan audio juga telah meningkat dengan ketara di seluruh papan, dengan Flash-Lite mengenakan caj $0.50 dolar Amerika Syarikat setiap juta token berbanding Flash-Lite 2.0 sebelumnya sebanyak $0.075 dolar Amerika Syarikat - mewakili lonjakan harga 6.3 kali ganda.
Ciri-ciri Utama Gemini 2.5 Flash-Lite
- Tetingkap Konteks: 1 juta token
- Masa Respons: Biasanya di bawah 400ms, serendah 200ms
- Keupayaan: Input multimodal, integrasi Google Search , pelaksanaan kod
- Mod Pemikiran: Tersedia dengan bajet yang boleh dilaraskan
- Kedudukan: Model paling kos-efisien dalam keluarga 2.5
Reaksi Komuniti Berpecah mengenai Kualiti Model
Maklum balas pembangun mengenai kemas kini terkini Gemini menunjukkan hasil yang bercampur-campur. Walaupun sesetengah pengguna memuji prestasi pengekodan yang bertambah baik dan tetingkap konteks yang besar, yang lain melaporkan kemerosotan kualiti berbanding versi pratonton yang lebih awal. Beberapa pembangun telah mencatatkan isu dengan respons yang bertele-tele, komen berlebihan dalam kod yang dijana, dan prestasi yang tidak konsisten.
Sistem pengehadan kadar juga telah menarik kritikan, dengan sesetengah pengguna tidak dapat mencapai peringkat perbelanjaan yang lebih tinggi disebabkan had permintaan yang ketat, memaksa mereka kembali kepada pesaing seperti OpenAI walaupun lebih suka keupayaan teknikal Gemini.
Perbandingan Harga Pemprosesan Audio
Model | Harga per Juta Token |
---|---|
Gemini 2.0 Flash-Lite | $0.075 |
Gemini 2.5 Flash-Lite | $0.50 |
Kenaikan Harga | 6.3x |
Harga Strategik Mencerminkan Kematangan Pasaran
Kenaikan harga sejajar dengan trend industri yang lebih luas ketika syarikat AI beralih daripada pemerolehan pelanggan yang agresif kepada model perniagaan yang mampan. Harga rendah awal Google membantu mewujudkan kehadiran pasaran, tetapi syarikat kini nampaknya cukup yakin untuk mengenakan kadar pasaran. Peralihan ini mencerminkan landskap AI yang semakin matang di mana penyedia menyeimbangkan peningkatan prestasi dengan tuntutan keuntungan.
Perubahan ini menyerlahkan cabaran berterusan untuk pembangun yang membina pada model pratonton, di mana kestabilan harga tidak dijamin sehingga ketersediaan umum. Ketika pasaran AI terus berkembang, syarikat mesti menimbang faedah keupayaan canggih berbanding risiko kos dan syarat yang berubah-ubah.