Google Nano Banana Pro Sasarkan Selesaikan Masalah Teks dan Kepercayaan AI

Pasukan Editorial BigGo
Google Nano Banana Pro Sasarkan Selesaikan Masalah Teks dan Kepercayaan AI

Google telah melancarkan Nano Banana Pro, peningkatan ketara kepada teknologi penjanaan imej AI-nya yang dibina atas model Gemini 3 Pro. Pelancaran baru ini menangani secara langsung dua cabaran paling berterusan dalam ruang imej AI: memaparkan teks yang boleh dibaca dan mewujudkan ketelusan kandungan. Model ini kini dilancarkan di seluruh ekosistem Google, daripada apl Gemini yang menghadap pengguna kepada alat profesional seperti Google Slides dan Ads, menandakan usaha besar untuk menjadikan visual terjana AI sesuai untuk kedua-dua penciptaan santai dan aplikasi perniagaan serius.

Lonjakan ke Hadapan dalam Pemaparan Teks dan Pengetahuan Dunia Sebenar

Penambahbaikan paling ketara dalam Nano Banana Pro ialah keupayaannya menjana teks yang tepat dan boleh dibaca dalam imej. Ini merupakan kelemahan terkenal bagi penjana imej AI, yang selalunya menghasilkan huruf yang rosak dan perkataan tidak masuk akal. Google mendakwa model ini menyampaikan "pemaparan teks sempurna," menyokong berbilang bahasa dan juga penterjemahan. Ujian awal menunjukkan ia boleh mencipta infografik yang koheren, melabel rajah dengan betul, dan menghasilkan bahan pemasaran dengan ayat penuh yang boleh dibaca. Keupayaan ini dikuasakan oleh penaakulan dipertingkatkan Gemini 3 Pro, yang membolehkan model itu menarik maklumat masa nyata daripada Google Search untuk mencipta visual kaya konteks seperti infografik berasaskan data atau resipi dengan arahan tepat.

Penambahbaikan Ciri Utama dalam Nano Banana Pro:

  • Model Asas: Dibina berdasarkan Gemini 3 Pro (berbanding Nano Banana asal pada Gemini 2.5 Flash).
  • Pemaparan Teks: Penjanaan teks dalam imej yang sempurna dan pelbagai bahasa.
  • Percampuran Imej: Menggabungkan elemen daripada sehingga 14 imej input.
  • Kekonsistenan Orang: Mengekalkan rupa sehingga 5 orang merentas generasi.
  • Kawalan Kreatif: Pengeditan setempat, pelarasan sudut kamera, kawalan fokus, penggredan warna.
  • Ketelusan: Pengecaman air SynthID dengan alat pengesahan awam dalam aplikasi Gemini.

Kawalan Kreatif Dipertingkat dan Integrasi Profesional

Bagi profesional, Nano Banana Pro menawarkan suite kawalan kreatif baru yang melangkaui penjanaan imej daripada prompt mudah. Pengguna kini boleh melakukan penyuntingan setempat, memperhalusi bahagian tertentu imej, dan melaraskan elemen seperti sudut kamera, fokus, penggredan warna, dan pencahayaan adegan. Model ini juga boleh menggabungkan elemen daripada sehingga 14 imej input berbeza sambil mengekalkan konsistensi dan persamaan sehingga lima orang, satu anugerah untuk mencipta kandungan berjenama. Integrasinya ke dalam suite profesional Google—termasuk Google Ads, Workspace, Slides, dan Vids—menekankan khalayak sasarannya: perniagaan yang mencari cara kos efektif untuk menghasilkan aset pemasaran dan bahan persembahan yang kemas.

Piawaian Baru untuk Ketelusan AI

Mungkin ciri paling berfikiran ke hadapan ialah alat ketelusan dipertingkat Google. Sesiapa kini boleh memuat naik imej ke dalam apl Gemini dan bertanya sama ada ia dijana oleh Google AI. Ini dikuasakan oleh SynthID, teknologi penandaan air digital Google yang menanamkan isyarat tidak ketara ke dalam media terjana AI. Walaupun model lain menggunakan penandaan air, Google menjadikan pengesahan boleh diakses terus oleh pengguna. Dalam langkah signifikan untuk pengguna profesional, pelanggan Google AI Ultra akan mempunyai penandaan air "gemerlap Gemini" yang kelihatan dialihkan daripada ciptaan mereka, mengakui keperluan untuk aset profesional yang bersih sambil mengekalkan tandatangan digital asas yang boleh disahkan.

Ketersediaan dan Model Akses

Nano Banana Pro tersedia di peringkat global dalam apl Gemini apabila pengguna memilih model 'Thinking'. Pengguna peringkat percuma menerima kuota harian terhad sebelum ditukar kembali kepada model Nano Banana asal. Pelanggan berbayar, termasuk pengguna Google AI Plus, Pro, dan Ultra, mendapat had penjanaan lebih tinggi. Bagi pemaju dan perusahaan, model ini boleh diakses melalui Gemini API, Google AI Studio, dan akan tidak lama lagi tersedia di Vertex AI. Model akses berperingkat ini membolehkan Google memenuhi keperluan semua orang daripada pengguna santai yang bereksperimen dengan AI kepada perniagaan besar yang menskalakan penciptaan kandungan.

Tingkat Akses untuk Nano Banana Pro:

  • Pengguna Percuma: Kuota harian terhad dalam aplikasi Gemini; tanda air kelihatan.
  • Pelanggan Google AI Plus/Pro/Ultra: Had penjanaan yang lebih tinggi.
  • AI Pro & Ultra (AS): Akses melalui Mod AI dalam aplikasi Gemini.
  • Pelanggan Google AI Ultra: Tiada tanda air kelihatan; akses dalam Flow (alat pembikinan filem AI).
  • Pembangun/Perniagaan: Akses melalui Gemini API, Google AI Studio, Vertex AI.
  • Workspace/Google Ads: Diintegrasikan untuk pelanggan perniagaan.

Keputusan mengenai Imej AI Gred Korporat

Ujian tangan awal mendedahkan alat dengan keupayaan luar biasa tetapi batasan biasa. Walaupun pemaparan teks jauh lebih baik, model ini masih boleh bergelut dengan tugas kompleks seperti pelabelan imej yang tepat. Dorongan untuk penggunaan profesional adalah jelas, dan resolusi serta kawalan yang dipertingkat pasti akan menarik minat perniagaan. Walau bagaimanapun, output masih boleh membawa estetik tersendiri, kadangkala tidak semula jadi, grafik terjana AI. Apabila teknologi ini terbenam dalam alat tempat kerja, era komunikasi korporat berbantukan AI sudah pasti tiba, menjanjikan kecekapan tetapi juga menimbulkan persoalan tentang penyeragaman media visual. Google Nano Banana Pro mewakili langkah besar dalam mematangkan penjanaan imej AI daripada suatu kebaruan kepada alat praktikal.