Kemas Kini Model Gemini Google Mencetuskan Perdebatan Komuniti Mengenai Isu Kebolehpercayaan dan Nombor Versi Yang Mengelirukan

Pasukan Komuniti BigGo
Kemas Kini Model Gemini Google Mencetuskan Perdebatan Komuniti Mengenai Isu Kebolehpercayaan dan Nombor Versi Yang Mengelirukan

Google telah mengeluarkan versi terkini bagi model Gemini 2.5 Flash dan Flash-Lite, dengan menjanjikan prestasi dan kecekapan yang lebih baik. Walau bagaimanapun, respons komuniti teknologi mendedahkan kebimbangan berterusan mengenai isu kebolehpercayaan dan amalan penamaan yang mengelirukan yang membayangi penambahbaikan teknikal tersebut.

Pengumuman model terbaru Gemini 25 Flash dan Flash-Lite, mempamerkan kemajuan terkini dalam teknologi AI
Pengumuman model terbaru Gemini 25 Flash dan Flash-Lite, mempamerkan kemajuan terkini dalam teknologi AI

Masalah Kebolehpercayaan Berterusan Terus Mengecewakan Pengguna

Walaupun terdapat peningkatan prestasi, pengguna melaporkan bahawa model Gemini masih mengalami kecacatan kritikal: respons yang tiba-tiba berhenti di tengah-tengah ayat. Ini bukan berkaitan dengan had token atau penapis kandungan, tetapi nampaknya merupakan pepijat dalam cara model memberi isyarat penyiapan. Isu ini telah didokumentasikan di GitHub dan forum pembangun selama berbulan-bulan sebagai masalah keutamaan-2, namun masih belum diselesaikan.

Kebimbangan kebolehpercayaan melangkaui respons yang terpotong. Pengguna menggambarkan prestasi yang tidak konsisten yang menjadikan Gemini terasa rosak berbanding pesaing seperti Claude dan GPT-4, walaupun kualiti respons lengkap adalah kompetitif. Ini mewujudkan pengalaman pengguna yang mengecewakan di mana pembangun mesti sentiasa menggesa model untuk meneruskan pemikiran yang tidak lengkap.

Isu Teknikal Utama

  • Pepijat pemotongan respons yang berterusan (didokumentasikan sebagai isu P2 di GitHub )
  • Respons terhenti di tengah ayat tanpa kaitan dengan had token atau penapis kandungan
  • Prestasi tidak konsisten yang menjejaskan kebolehpercayaan dalam persekitaran pengeluaran
  • Isu dengan fungsi UI ringkas seperti skrol dalam AI Studio
  • Masalah penyerlahan sintaks dalam antara muka web

Kekeliruan Penamaan Versi Mendapat Kritikan Industri

Komuniti telah menyatakan kekecewaan yang ketara dengan pendekatan Google terhadap versi model. Daripada menambah nombor versi untuk kemas kini, Google terus menggunakan 2.5 sambil menambah pengecam berasaskan tarikh yang kompleks seperti gemini-2.5-flash-preview-09-2025. Amalan ini menyukarkan pembangun untuk menjejaki perubahan dan menguruskan aliran kerja mereka dengan berkesan.

Nombor versi menjadi tidak berguna dengan dasar seperti itu.

Kekeliruan ini diburukkan lagi dengan pengenalan alias -latest oleh Google, yang secara automatik menunjuk ke versi model terbaru. Walaupun bertujuan untuk memudahkan akses, pendekatan ini menimbulkan kebimbangan mengenai perubahan tingkah laku yang tidak dijangka dalam aplikasi pengeluaran. Google menjanjikan notis dua minggu sebelum kemas kini, tetapi ramai pembangun lebih suka kestabilan nombor versi tetap.

Pengecam Model dan Akses

  • Versi pratonton baharu: gemini-2.5-flash-preview-09-2025 dan gemini-2.5-flash-lite-preview-09-2025
  • Alias terkini: gemini-flash-latest dan gemini-flash-lite-latest
  • Versi stabil: gemini-2.5-flash dan gemini-2.5-flash-lite
  • Tersedia di: Google AI Studio dan Vertex AI

Peningkatan Prestasi Menunjukkan Potensi Walaupun Terdapat Isu

Penambahbaikan teknikal dalam kemas kini ini patut diberi perhatian. Gemini 2.5 Flash-Lite memberi tumpuan kepada mengikut arahan yang lebih baik, mengurangkan kepanjangan, dan keupayaan multimodal yang lebih kuat. Model Flash menunjukkan peningkatan 5% pada penanda aras SWE-Bench Verified (dari 48.9% kepada 54%) dan menunjukkan penggunaan alat yang lebih baik untuk aplikasi kompleks.

Pengguna melaporkan bahawa Gemini cemerlang dalam bidang khusus seperti penaakulan konteks panjang, pengecaman imej, dan sokongan berbilang bahasa. Keberkesanan kos model menjadikannya menarik untuk aplikasi volum tinggi, dengan sesetengah pengguna mencapai kecekapan token keluaran yang 24% hingga 50% lebih baik.

Peningkatan Prestasi

  • Penanda aras SWE-Bench Verified : 48.9% → 54% (peningkatan 5%)
  • Kecekapan token keluaran: peningkatan 24% hingga 50%
  • Mengurangkan latensi respons untuk aplikasi throughput tinggi
  • Mengikut arahan dengan lebih baik dan mengurangkan kepanjangan dalam Flash-Lite
  • Keupayaan multimodal yang dipertingkatkan termasuk transkripsi audio dan pemahaman imej
Plot taburan yang membandingkan pelbagai versi Gemini 25 berdasarkan Indeks Kecerdasan dan prestasi masa tindak balas mereka
Plot taburan yang membandingkan pelbagai versi Gemini 25 berdasarkan Indeks Kecerdasan dan prestasi masa tindak balas mereka

Kedudukan Pasaran Kekal Kompetitif Walaupun Terdapat Cabaran

Perbincangan komuniti mendedahkan bahawa Gemini 2.5 Flash telah menjadi model pilihan ramai pengguna untuk tugas tertentu, terutamanya pemprosesan imej dan keluaran berstruktur. Kelebihan kelajuan dan harganya berbanding pesaing seperti model OpenAI dan Anthropic menjadikannya popular untuk aplikasi di mana isu kebolehpercayaan boleh diuruskan melalui pengendalian ralat yang betul.

Walau bagaimanapun, masalah teknikal berterusan dan amalan versi yang mengelirukan menyerlahkan jurang antara keupayaan teknikal Google dan pelaksanaan pengalaman pengguna. Walaupun teknologi asas menunjukkan potensi, isu operasi ini terus mengehadkan penggunaan Gemini yang lebih luas dalam persekitaran pengeluaran di mana konsistensi adalah penting.

Kemas kini ini mewakili kemajuan berperingkat, tetapi tumpuan komuniti terhadap kebimbangan kebolehpercayaan dan kebolehgunaan asas menunjukkan bahawa Google perlu menangani isu asas ini sebelum pengguna akan menerima sepenuhnya keupayaan lanjutan platform tersebut.

Rujukan: Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release