Google telah melancarkan kemas kini penting kepada platform AI Gemini, memperkenalkan keupayaan penyuntingan imej yang dipertingkatkan dan ciri sembang sementara yang berfokuskan privasi. Perkembangan ini menandakan langkah besar ke hadapan dalam penawaran AI syarikat tersebut, walaupun ia juga menimbulkan persoalan penting mengenai teknologi deepfake dan manipulasi digital.
Penyuntingan Imej Revolusioner dengan Gemini 2.5 Flash
Teras kemas kini terbaru Google adalah model penjanaan imej Gemini 2.5 Flash, yang dinamakan secara jenaka sebagai Nano Banana oleh pasukan pembangunan. Sistem AI yang dipertingkatkan ini mewakili lonjakan besar dalam konsistensi dan kualiti penyuntingan imej. Model ini kini berada di puncak papan pendahulu penyuntingan imej LMArena, menunjukkan keunggulan teknikalnya berbanding penyelesaian pesaing.
Keupayaan baharu membolehkan pengguna menggabungkan beberapa foto dengan lancar, meletakkan diri mereka bersama haiwan kesayangan atau dalam persekitaran yang sama sekali berbeza sambil mengekalkan konsistensi visual. Pengguna boleh mengubah penampilan mereka menjadi pelbagai watak, daripada matador hingga personaliti sitkom 1990-an, dengan ketepatan yang luar biasa. Sistem ini cemerlang dalam penyuntingan berbilang giliran, membolehkan perubahan berperingkat pada imej tanpa memperkenalkan ketidakkonsistenan visual yang biasanya melanda kandungan yang dijana AI.
Ciri-ciri Utama Gemini 2.5 Flash "Nano Banana":
- Penyuntingan imej berbilang giliran dengan penyelenggaraan konsistensi
- Gabungan subjek daripada pelbagai foto
- Manipulasi latar belakang dan perubahan pemandangan
- Keupayaan transformasi watak
- Kini menduduki tempat ke-1 dalam papan pendahulu penyuntingan imej LMArena
- Tidak dapat melakukan pemangkasan asas kepada nisbah aspek tertentu
Ciri Canggih dan Had
Aplikasi Gemini yang dikemas kini Google kini menyokong manipulasi latar belakang yang canggih dan integrasi subjek. Pengguna boleh memotret bilik kosong dan menugaskan AI untuk melengkapinya dengan perabot, atau menukar kertas dinding untuk pratonton pilihan reka bentuk dalaman. Sistem ini mengekalkan koheren merentas beberapa sesi penyuntingan, menangani kelemahan biasa dalam editor imej AI sebelumnya.
Walau bagaimanapun, teknologi ini masih menunjukkan had yang mengejutkan. Walaupun keupayaannya canggih, sistem ini tidak dapat melakukan tugas asas seperti memotong imej kepada nisbah aspek tertentu. Apabila diminta menukar imej persegi kepada format 16:9, Gemini dengan jelas menyatakan bahawa ia tidak mampu melakukan suntingan tepat seperti memotong imej kepada nisbah aspek tertentu.
Kebimbangan Privasi dan Implikasi Deepfake
Keupayaan penyuntingan imej yang dipertingkatkan menimbulkan kebimbangan besar mengenai manipulasi digital dan keaslian. Sistem ini boleh menjana imej selebriti yang telah meninggal dunia dalam senario yang benar-benar rekaan dengan sangat meyakinkan, mencabar keupayaan pengguna untuk membezakan antara kandungan sebenar dan yang dijana AI. Walaupun Google menyertakan tanda air yang boleh dilihat pada semua imej yang dijana, ini boleh diabaikan dengan mudah atau dibuang oleh pelaku berniat jahat menggunakan perisian penyuntingan standard.
Google telah melaksanakan sistem tanda air digital SynthID yang tidak kelihatan yang direka untuk dikesan oleh SynthID Detector syarikat tersebut. Walau bagaimanapun, sistem pengesanan ini kekal dalam fasa ujian terhad dan belum boleh diakses secara meluas oleh orang ramai, mewujudkan jurang dalam keupayaan pengesahan.
Langkah Keselamatan dan Pengesahan:
- Tera air yang boleh dilihat pada semua imej yang dijana oleh AI
- Sistem tera air digital SynthID yang tidak kelihatan
- SynthID Detector untuk pengesahan (ketersediaan terhad)
- Tera air boleh dipotong keluar oleh perisian pihak ketiga
Ciri Sembang Sementara Meningkatkan Privasi
Bersama kemas kini penyuntingan imej, Google telah memperkenalkan fungsi Sembang Sementara kepada Gemini, menyamai ciri yang sudah tersedia dalam platform pesaing seperti ChatGPT. Alat yang berfokuskan privasi ini membolehkan pengguna berinteraksi dengan AI tanpa menyimpan sejarah perbualan, menangani kebimbangan yang semakin meningkat mengenai penyimpanan data dan privasi.
Ciri sembang sementara boleh diakses melalui ikon sembang bergaris putus-putus yang diletakkan bersebelahan dengan butang sembang baharu standard. Perbualan dalam mod ini tidak menyumbang kepada latihan model, personalisasi, atau muncul dalam sejarah sembang. Walau bagaimanapun, Google mengekalkan perbualan ini selama 72 jam untuk tujuan keselamatan dan pengoptimuman respons.
Spesifikasi Sembang Sementara:
- Tersedia di platform Android , iOS , dan web
- Perbualan tidak digunakan untuk latihan model atau personalisasi
- Data disimpan selama 72 jam untuk tujuan keselamatan
- Tiada akses kepada sejarah sembang sementara sebelumnya
- Terhad kepada akaun peribadi Google sahaja (bukan akaun kerja/sekolah)
Ketersediaan dan Akses
Ciri sembang sementara kini sedang dilancarkan kepada semua pengguna Google Gemini merentas platform Android, iOS, dan web. Fungsi ini tersedia kepada pengguna dengan akaun Google peribadi, walaupun mereka yang menggunakan akaun berasaskan sekolah atau kerja pada masa ini tidak mempunyai akses. Keupayaan penjanaan imej, termasuk ciri Nano Banana baharu, tersedia kepada semua pengguna tanpa mengira status langganan, walaupun pelan premium membuka kunci ciri tambahan.
Kemas kini ini mewakili pelaburan berterusan Google dalam keupayaan AI sambil menyerlahkan cabaran berterusan untuk mengimbangi inovasi dengan penggunaan yang bertanggungjawab dalam era kebimbangan yang semakin meningkat mengenai manipulasi digital dan privasi.