Kenaikan Harga Google Gemini Flash Mencetuskan Perdebatan Mengenai Realiti Kos AI

Pasukan Komuniti BigGo

Kenaikan Harga Google Gemini Flash Mencetuskan Perdebatan Mengenai Realiti Kos AI

Google baru-baru ini membuat langkah mengejutkan yang menangkap ramai pembangun AI secara tidak berjaga-jaga. Gergasi teknologi ini meningkatkan harga secara ketara untuk model Gemini 2.5 Flash yang popular, menandakan kali pertama penyedia AI utama menaikkan harga pada model yang telah sedia ada. Keputusan ini telah mencetuskan perdebatan sengit dalam komuniti pembangun mengenai sama ada kita telah mencapai penghujung era AI yang murah.

Lonjakan Harga Yang Memulakan Segalanya

Perubahan harga adalah ketara. Kos token input meningkat dua kali ganda daripada $0.125 kepada $0.25 per juta token dolar Amerika Syarikat, manakala harga output meningkat lebih daripada empat kali ganda daripada $0.60 kepada $2.50 per juta token dolar Amerika Syarikat. Walau bagaimanapun, situasi ini lebih kompleks daripada yang kelihatan pada mulanya. Ahli komuniti dengan pantas menunjukkan bahawa Google sebelum ini menawarkan dua versi Flash - satu dengan mod pemikiran dan satu tanpanya. Penetapan harga baharu pada dasarnya telah menghentikan versi tanpa pemikiran yang lebih murah sepenuhnya.

Sesetengah pengguna mendapati perubahan ini amat mengecewakan. Seorang pembangun menyatakan bagaimana ciri pemikiran sering terperangkap dalam gelung, mempersoalkan dirinya sendiri sehingga mencapai had token tanpa menghasilkan pandangan yang bermakna. Ini telah membawa kepada kebimbangan mengenai pembayaran harga yang lebih tinggi untuk ciri yang tidak sentiasa menambah nilai.

Perubahan Harga Gemini 2.5 Flash

Token input: $0.125 → $0.25 setiap juta (peningkatan 100%)
Token output: $0.60 → $2.50 setiap juta (peningkatan 317%)
Gemini 2.5 Flash Lite baharu diperkenalkan pada titik harga yang lebih rendah

Mengapa Penetapan Harga Linear Tidak Sepadan Dengan Kos Kuadratik

Isu teras terletak pada cara model AI sebenarnya berfungsi berbanding cara ia dihargakan. Model bahasa besar mempunyai kos pengiraan kuadratik - apabila panjang urutan meningkat, kuasa pemprosesan yang diperlukan berkembang secara eksponen. Namun penyedia mengenakan bayaran kepada pelanggan pada kadar tetap per token, mewujudkan ketidakpadanan antara kos sebenar dan penetapan harga.

Fikirkan seperti stesen minyak di mana membeli sepuluh gelen sekaligus menelan kos yang lebih tinggi per gelen untuk stesen berbanding menjual satu gelen pada satu masa. Akhirnya, pembelian pukal akan merugikan stesen. Penyedia AI menghadapi cabaran serupa apabila pelanggan menggunakan model untuk tugas dengan input panjang dan output pendek, seperti rumusan dokumen.

Kos kuadratik merujuk kepada keperluan pengiraan yang meningkat dengan kuasa dua saiz input, bermakna dua kali input memerlukan empat kali kuasa pemprosesan.

Struktur Kos Teknikal

Kos LLM meningkat secara kuadratik (O(n²)) dengan panjang urutan
Penyedia mengenakan harga linear setiap token
Fasa prefill: memproses token input secara selari (intensif pengkomputeran)
Fasa decode: menghasilkan token output secara bersiri (terhad lebar jalur memori)

Keraguan Komuniti Mengenai Penghujung Hukum Moore

Ramai dalam komuniti pembangun kekal ragu-ragu mengenai dakwaan bahawa pengurangan kos AI sedang berakhir. Mereka menunjuk kepada contoh terkini seperti penurunan harga 80% OpenAI untuk model o3 hanya beberapa minggu lalu sebagai bukti bahawa pengoptimuman ketara masih mungkin. Kadar pesat penambahbaikan perkakasan dan perisian menunjukkan masih ada ruang untuk pengurangan kos.

Walaupun dengan berapa banyak harga telah menurun dalam tempoh 3 tahun yang lalu, saya fikir masih ada ruang untuk ia terus menurun. Saya menjangkakan masih terdapat banyak pengoptimuman yang belum ditemui, dalam kedua-dua perisian dan perkakasan.

Sesetengah pembangun berhujah ini hanyalah Google memanfaatkan populariti Gemini yang semakin meningkat dan bukannya mencapai halangan kos asas. Sehingga baru-baru ini, Gemini dianggap sebagai yang kurang berjaya berbanding ChatGPT dan Claude. Kini setelah ia mendapat pengiktirafan, Google mungkin berasa selesa mengenakan kadar pasaran dan bukannya menawarkan harga promosi.

Konteks Pasaran

Pembekal utama pertama yang menaikkan harga pada model yang telah mantap
OpenAI baru-baru ini menurunkan harga o3 sebanyak 80%
DeepSeek V3 mendakwa margin keuntungan 80% pada harga $0.27/$1.10
Google sebelum ini menawarkan harga promosi $0.00 pada model pratonton

Realiti Perniagaan Di Sebalik Cerita Teknikal

Beberapa ahli komuniti menyatakan bahawa Google adalah syarikat tersenarai awam dengan kewajipan pemegang saham, tidak seperti sesetengah pesaing yang mungkin beroperasi dengan kerugian untuk merebut bahagian pasaran. Tekanan perniagaan ini boleh menjelaskan pelarasan harga lebih daripada batasan teknikal.

Pengenalan Gemini 2.5 Flash Lite pada harga yang lebih rendah menyokong teori ini. Ia adalah strategi segmentasi pasaran klasik - jika anda mahukan harga yang sangat rendah, anda menerima model yang kurang berkebolehan. Jika anda mahukan prestasi penuh, anda membayar harga yang lebih mencerminkan kos operasi.

Apa Ini Bermakna Untuk Pembangun

Kenaikan harga mempunyai implikasi praktikal untuk sesiapa yang membina aplikasi AI. Pembangun tidak lagi boleh menganggap bahawa ciri mahal hari ini akan secara automatik menjadi mampu milik esok melalui kemajuan teknologi sahaja. Pengurusan kos sedang menjadi keputusan seni bina teras dan bukannya pemikiran selepas pengoptimuman.

Peralihan ini mendorong minat yang diperbaharui dalam alternatif seperti pemprosesan kelompok dan model sumber terbuka. Apabila kos API masa nyata mempunyai had yang keras, penjimatan relatif daripada menjalankan infrastruktur sendiri atau menggunakan pemprosesan bukan masa nyata menjadi lebih menarik.


Lalu lintas padat di pondok tol melambangkan cabaran yang dihadapi pembangun dengan kenaikan kos AI dan keperluan untuk pengurusan kos yang cekap

Kesimpulan

Sama ada kenaikan harga Google menandakan penghujung AI murah atau hanya mencerminkan dinamik pasaran biasa kekal diperdebatkan dengan hangat. Realiti teknikal kos pengiraan kuadratik adalah nyata, tetapi begitu juga dengan kadar berterusan pengoptimuman dan penambahbaikan perkakasan.

Apa yang jelas ialah era menganggap kos AI akan terus menurun mungkin sedang berakhir. Pembangun sedang belajar untuk menganggap penetapan harga AI sebagai kekangan perniagaan dan bukannya kesulitan sementara. Pendekatan yang lebih realistik terhadap ekonomi AI ini mungkin sebenarnya membawa kepada aplikasi yang lebih baik dan lebih mampan dalam jangka panjang.

Rujukan: The End of Moore's Law for AI? Gemini Flash Offers a Warning