AI Google Gemini Kini Mengubah Foto Menjadi Video Dengan Audio Dijana AI

Pasukan Editorial BigGo

AI Google Gemini Kini Mengubah Foto Menjadi Video Dengan Audio Dijana AI

Google telah memperkenalkan kemas kini penting kepada platform AI Gemini nya, membolehkan pengguna menukar gambar statik kepada kandungan video dinamik dengan audio yang disegerakkan. Peningkatan ini membawa keupayaan penjanaan video canggih terus ke dalam antara muka Gemini , menjadikan penciptaan video berkuasa AI lebih mudah diakses oleh pelanggan.

Dikuasakan oleh Teknologi Model Video Veo 3

Fungsi foto-ke-video baharu ini memanfaatkan model video Veo 3 milik Google , yang mewakili kemajuan terkini syarikat dalam teknologi penjanaan video AI. Pengguna boleh mengubah imej rujukan menjadi klip video lapan saat lengkap dengan elemen audio dijana AI, termasuk bunyi latar belakang, bunyi persekitaran, dan pertuturan. Ciri ini pada mulanya telah dipamerkan di persidangan pembangun tahunan Google pada bulan Mei tetapi sebelum ini hanya tersedia melalui Flow , aplikasi pembuatan filem kendiri Google .

Spesifikasi Video:

Tempoh: maksimum 8 saat
Resolusi: 720p
Format: fail MP4 dalam format landskap 16:9
Audio: bunyi latar belakang yang dijana AI, bunyi persekitaran, dan pertuturan
Tera air: tera air yang boleh dilihat + tera air digital SynthID yang tidak kelihatan

Akses Dipermudah Melalui Antara Muka Gemini

Pelanggan Google AI Ultra dan Pro kini boleh mengakses ciri ini terus melalui antara muka sembang Gemini tanpa perlu beralih kepada aplikasi berasingan. Pengguna hanya perlu mengklik pilihan alat dalam bar gesaan, pilih video, dan muat naik gambar mereka bersama dengan penerangan teks yang menyatakan pergerakan dan elemen audio yang dikehendaki. Sistem ini menjana fail MP4 pada resolusi 720p dalam format landskap 16:9, dengan Google menjanjikan bahawa penerangan audio untuk dialog, kesan bunyi, dan bunyi ambien akan disegerakkan dengan sempurna dengan visual.

Keperluan Akses:

Langganan: Pelan Google AI Ultra atau Pro
Ketersediaan: Wilayah terpilih pada mulanya
Platform: Versi web (dilancarkan dahulu), aplikasi mudah alih (lewat minggu ini)
Kaedah akses: Tools → Video → Muat naik foto + penerangan teks

Butiran Pelancaran dan Ketersediaan

Ciri ini sedang dilancarkan ke wilayah terpilih, bermula dengan versi web Gemini dan berkembang ke peranti mudah alih sepanjang minggu. Penggunaan beransur-ansur ini membolehkan Google memantau prestasi dan maklum balas pengguna semasa teknologi ini mencapai khalayak yang lebih luas. Pada masa yang sama, Google mengumumkan bahawa Flow akan dilancarkan di 75 negara tambahan, mengembangkan ekosistem penjanaan video AI syarikat secara global.

Batasan Semasa dan Isu Prestasi

Ujian telah mendedahkan beberapa batasan dalam pelaksanaan semasa. Penilaian Bloomberg mendapati bahawa AI kadangkala mengubah wajah orang atau menukar bangsa mereka semasa mencipta video bercakap daripada gambar. Gesaan kompleks, seperti membuat seseorang breakdance, sering menghasilkan keputusan yang tidak dijangka seperti isyarat lambai yang mudah dan bukannya tindakan yang diminta. Google mengakui isu-isu ini, dengan jurucakap menjelaskan bahawa AI tidak diprogramkan untuk mengubah penampilan dan teknologi ini terus berkembang.

Sekatan Kandungan:

Tiada selebriti, ahli politik, atau tokoh awam
Tiada kandungan keganasan atau buli
Prestasi terbaik: Pemandangan alam semula jadi, lukisan, objek
Isu yang diketahui: Pengubahan wajah, perubahan kaum dalam video bercakap

Langkah Keselamatan dan Garis Panduan Kandungan

Google telah melaksanakan garis panduan ketat untuk mencegah penyalahgunaan teknologi penjanaan video. Sistem ini melarang penciptaan video menggunakan imej selebriti, ahli politik, atau tokoh awam lain, dan enggan menghasilkan kandungan yang menggalakkan keganasan atau buli. Semua video yang dijana termasuk tanda air yang boleh dilihat menunjukkan penjanaan AI, ditambah dengan tanda air digital SynthID yang tidak kelihatan untuk tujuan pengenalan dan penjejakan tambahan.

Kedudukan Persaingan dalam Pasaran Video AI

Kemas kini ini meletakkan Google untuk bersaing dengan lebih berkesan dengan pesaing termasuk OpenAI , Runway , Alibaba , dan Kuaishou dalam pasaran penjanaan video AI yang berkembang pesat. Dengan mengintegrasikan keupayaan penciptaan video terus ke dalam Gemini , Google mengurangkan geseran untuk pengguna sambil mengembangkan aplikasi praktikal platform AI nya. Syarikat menunjukkan bahawa penambahbaikan kepada animasi wajah dan prestasi keseluruhan dirancang untuk kemas kini masa depan semasa teknologi ini matang.