Google telah meningkatkan platform AI Gemini dengan keupayaan penyuntingan imej canggih yang mengaburkan sempadan antara kecerdasan buatan dan alat manipulasi foto tradisional. Ciri-ciri baharu ini, dikuasakan oleh model Gemini 2.5 Flash Image (sebelum ini diuji dengan nama kod nano banana), mewakili lonjakan besar dalam kebolehcapaian dan kualiti penyuntingan foto berkuasakan AI.
Ciri-ciri Teknikal Utama
- Nama Model: Gemini 2.5 Flash Image (dahulunya dikenali sebagai "nano banana")
- Pemeliharaan Butiran: Mengekalkan butiran halus seperti tekstur rambut dan ekspresi wajah semasa penyuntingan
- Penyuntingan Berbilang Pusingan: Membenarkan penambahbaikan berulang pada imej asas yang sama
- Pemindahan Gaya: Mengaplikasikan tekstur dan corak dari satu imej ke imej yang lain
- Pengadunan Foto: Menggabungkan berbilang foto sumber menjadi adegan komposit
![]() |
---|
Imej seseorang yang memeluk seekor kucing, mempamerkan ciri-ciri penjanaan imej canggih Google Gemini |
Teknologi Pemeliharaan Perincian Revolusioner
Kemajuan paling ketara dalam model terkini Gemini terletak pada keupayaannya untuk mengekalkan perincian halus merentasi berbilang iterasi foto. Tidak seperti versi sebelumnya yang pada dasarnya menjana semula imej dari awal dengan setiap permintaan suntingan, sistem baharu ini dengan bijak memelihara elemen khusus foto sumber sambil hanya mengubah suai perubahan yang diminta. Terobosan ini membolehkan pengguna membuat pelarasan yang disasarkan, seperti menukar warna baju dari merah kepada biru, sambil mengekalkan perincian rumit seperti tekstur rambut, ekspresi wajah, dan pose. Teknologi ini menunjukkan ketepatan yang luar biasa dalam memahami konteks dan memfokuskan suntingan pada objek atau kawasan tertentu dalam imej.
Penyuntingan Berbilang Pusingan Mengubah Pengalaman Pengguna
Pengenalan keupayaan penyuntingan berbilang pusingan secara asasnya mengubah cara pengguna berinteraksi dengan penjanaan imej AI. Ciri ini membolehkan penambahbaikan berulang pada imej asas yang sama, membenarkan pengguna memperhalusi hasil secara progresif daripada memulakan semula dengan setiap pengubahsuaian. Pengguna kini boleh membina atas suntingan sebelumnya, menambah elemen seperti bintik polka pada baju yang warnanya telah diubah atau mengubah imej yang dijana AI sepenuhnya melalui pengubahsuaian berturut-turut. Pendekatan berulang ini mengubah Gemini daripada alat kebaharuan kepada alternatif yang berpotensi berdaya maju kepada perisian penyuntingan foto profesional seperti Adobe Photoshop.
![]() |
---|
Imej yang dijana AI menunjukkan seseorang dalam pergerakan, mencerminkan kemungkinan kreatif yang dinamik bagi ciri penyuntingan berbilang giliran dalam Gemini |
Aplikasi Kreatif dan Transformasi Gaya
Platform Gemini yang dipertingkatkan memperkenalkan beberapa aplikasi yang menghiburkan dan praktikal, termasuk peralihan gaya yang boleh mengubah pengguna menjadi watak dari dekad atau profesion yang berbeza. Sistem ini boleh menggabungkan berbilang foto sumber untuk mencipta adegan komposit, seperti meletakkan pengguna bersama tokoh sejarah atau dalam tetapan yang berbeza. Keupayaan pemindahan gaya membolehkan pengguna menggunakan tekstur dan corak dari satu imej kepada pakaian atau objek dalam imej lain, mencipta kesan visual yang unik. Ciri-ciri ini membuka kemungkinan kreatif untuk kandungan media sosial, projek artistik, dan tujuan hiburan.
![]() |
---|
Panel bersebelahan seekor kucing, menggambarkan bagaimana Google Gemini boleh mengubah imej secara kreatif sambil mengekalkan butiran asal |
Had Berterusan dalam Komposisi Kompleks
Walaupun terdapat penambahbaikan ketara, Gemini masih bergelut dengan gabungan imej yang lebih kompleks yang memerlukan interpolasi AI yang besar. Apabila diminta untuk menggabungkan berbilang foto ke dalam adegan yang sama sekali baharu, sistem sering menghasilkan imej dengan ciri AI yang mudah dikenal pasti, termasuk penampilan yang terlalu diproses, pencahayaan yang tidak semula jadi, dan perkadaran yang tidak konsisten. Teknologi ini berprestasi terbaik apabila membuat pengubahsuaian kecil kepada foto sedia ada tetapi menjadi kurang meyakinkan apabila menjana kandungan baharu yang kekurangan bahan sumber yang mencukupi untuk rujukan.
Batasan Semasa
- Komposisi Kompleks: Menghadapi kesukaran dengan adegan yang memerlukan interpolasi AI yang besar
- Penampilan AI: Rupa yang terlalu diproses seperti "Vaseline" dalam suntingan yang mencabar
- Isu Perkadaran: Saiz yang tidak konsisten dan elemen tidak semula jadi dalam imej komposit
- Kelemahan Metadata: Tera air dan metadata boleh dibuang oleh pengguna
Implikasi untuk Ketulenan Media Digital
Keupayaan yang dipertingkatkan menimbulkan kebimbangan penting mengenai masa depan ketulenan foto dan pengesahan media digital. Walaupun imej AI yang direka sepenuhnya masih agak mudah dikenal pasti, keupayaan Gemini untuk membuat pengubahsuaian yang halus dan realistik kepada foto tulen mencipta cabaran baharu untuk membezakan kandungan autentik daripada bahan yang diubah AI. Potensi untuk mencipta imejan yang meyakinkan tetapi palsu mempunyai implikasi untuk kewartawanan, media sosial, dan wacana awam, terutamanya apabila digabungkan dengan penyuntingan berulang yang boleh meningkatkan realisme kandungan yang dimanipulasi secara progresif.
Perlindungan Terbina Dalam dan Kaedah Pengesanan
Google telah melaksanakan beberapa langkah untuk menangani kebimbangan ketulenan, termasuk tanda air yang boleh dilihat di sudut kiri bawah semua imej yang dijana atau diubah suai AI dan tag metadata terbenam yang mengenal pasti penglibatan AI. Sistem tanda air SynthID syarikat menggunakan penanda yang boleh dilihat dan tidak kelihatan untuk membantu pengguna mengenal pasti kandungan yang dicipta AI. Walau bagaimanapun, perlindungan ini mempunyai had, kerana metadata boleh dialih keluar dan tanda air mungkin tidak jelas dengan serta-merta dalam situasi tontonan biasa. Pengguna yang bimbang tentang ketulenan imej boleh menggunakan carian imej terbalik untuk mencari versi asal yang tidak diubah suai bagi foto yang mencurigakan.
Langkah Perlindungan
- Tera Air Boleh Dilihat: Digunakan pada sudut kiri bawah semua imej yang dijana AI
- Tag Metadata: Amaran "Dibuat dengan AI" yang tertanam dalam fail imej
- Sistem SynthID: Teknologi tera air yang boleh dilihat dan tidak boleh dilihat
- Carian Terbalik: Pengguna boleh mencari versi asal yang tidak diubah suai bagi imej yang mencurigakan
Kesan Industri dan Perkembangan Masa Hadapan
Kemajuan ini meletakkan alat AI percuma Google sebagai pesaing yang sah kepada perisian penyuntingan foto yang mantap, berpotensi mengganggu aliran kerja kreatif tradisional. Adobe telah mengumumkan rancangan untuk memasukkan teknologi nano banana ke dalam Photoshop, menunjukkan pengiktirafan industri terhadap kepentingan inovasi tersebut. Apabila keupayaan penyuntingan imej AI terus bertambah baik, pencipta kandungan dan pengguna biasa perlu menyesuaikan diri dengan alat baharu yang boleh mencapai suntingan kompleks melalui gesaan bahasa semula jadi yang mudah daripada proses manual teknikal.