Gergasi AI China SenseTime telah membuat langkah besar dalam sektor kecerdasan berperibadi dengan memperkenalkan platform terobosan Wu Neng di persidangan WAIC 2025 . Platform komprehensif ini mewakili kemajuan utama dalam merapatkan jurang antara kecerdasan buatan dan keupayaan interaksi dunia sebenar untuk robot dan peranti pintar.
![]() |
---|
CEO Xu Li mempersembahkan platform Wu Neng , menandakan lonjakan ketara dalam kecerdasan terkandung di persidangan WAIC 2025 |
Teknologi Teras dan Seni Bina
Platform kecerdasan berperibadi Wu Neng dibina berdasarkan model dunia berperibadi proprietari SenseTime , yang berfungsi sebagai enjin teras yang memacu keupayaan sistem. Seni bina canggih ini memanfaatkan infrastruktur pengkomputeran berskala besar SenseTime untuk menyediakan sokongan pengiraan di bahagian tepi dan awan. Platform ini direka khusus untuk meningkatkan robot dan peranti pintar dengan keupayaan persepsi yang berkuasa, sistem navigasi visual, dan keupayaan interaksi multimodal, mendorong terminal pintar ke arah tahap autonomi dan kecerdasan yang lebih tinggi.
Keupayaan Platform
- Persepsi dan pemahaman terhadap persekitaran dunia sebenar
- Sistem navigasi visual
- Keupayaan interaksi multimodal
- Sokongan pengkomputeran bahagian tepi dan bahagian awan
- Pembenaman langsung ke dalam cip bahagian tepi
Integrasi Perkakasan Serbaguna dan Pelaksanaan
Salah satu ciri platform yang paling menarik ialah kebolehsuaiannya yang luar biasa merentasi pelbagai konfigurasi perkakasan. Platform Wu Neng boleh berintegrasi dengan lancar dengan pelbagai jenis sistem robotik dan peranti terminal, membolehkan mereka mencapai persepsi dan pemahaman menyeluruh tentang dunia di sekeliling mereka. Fleksibiliti sistem meluas kepada pilihan pelaksanaannya, kerana ia menyokong pembenaman terus ke dalam cip bahagian tepi, menyediakan kebolehsuaian senario yang kuat yang menjadikannya sesuai untuk pelbagai aplikasi dunia sebenar.
Demonstrasi Langsung dan Interaksi Semula Jadi
Semasa pembentangan persidangan, Pengerusi dan CEO SenseTime Xu Li mempamerkan keupayaan platform melalui demonstrasi langsung yang mengagumkan. Robot humanoid yang dilengkapi dengan enjin dunia berperibadi menyampaikan pembentangan yang semula jadi dan menarik tentang Lychee Chang'an , menunjukkan kemahiran komunikasi yang sangat mirip manusia. Robot tersebut mempamerkan keupayaan pembentangan yang canggih, termasuk memusing halaman secara automatik, menjawab pelbagai soalan daripada hadirin, dan menyediakan ringkasan berkala sepanjang pembentangan. Demonstrasi tersebut menyerlahkan keupayaan platform untuk memudahkan interaksi yang semula jadi, lucu, dan sesuai dengan konteks.
Contoh Demonstrasi
- Robot humanoid mempersembahkan PPT " Chang'an's Lychees "
- Keupayaan tukar halaman automatik dan soal jawab
- Arahan bahasa semula jadi: "cari sesuatu di rak dalam kawasan dapur"
- Navigasi kompleks: "masuk ke bilik hiburan, belok kanan, kemudian buka pintu ke halaman"
![]() |
---|
Demonstrasi model dunia terkandung yang mempamerkan bagaimana robot boleh mengikut arahan bahasa semula jadi untuk melaksanakan tugasan |
Penjanaan Video Termaju dan Pemahaman Spatial
Model dunia berperibadi melangkaui keupayaan interaksi asas untuk merangkumi ciri penjanaan video yang canggih. Sistem ini boleh mencipta video berbilang perspektif sambil mengekalkan konsistensi temporal dan spatial yang cemerlang, membolehkan mesin memahami, menjana, dan mengedit representasi dunia sebenar. Keupayaan ini membuka kemungkinan menarik untuk interaksi dunia peringkat spatial, menjadikan senario seperti bermain permainan lumba dalam persekitaran jalan sebenar boleh dilaksanakan secara teknikal.
Ciri-ciri Teknikal
- Penjanaan video berbilang perspektif dengan konsistensi temporal dan spatial
- Pembinaan dunia 4D untuk manusia, objek, dan pemandangan
- Pemprosesan arahan bahasa semula jadi
- Penjanaan autonomi bagi kedudukan, pergerakan, dan arahan
- Keupayaan interaksi dan penyuntingan dunia sebenar
Pembinaan Dunia 4D dan Kawalan Intuitif
Model dunia berperibadi SenseTime menunjukkan keupayaan luar biasa dalam membina representasi 4D persekitaran dunia sebenar yang merangkumi orang, objek, dan adegan. Sistem ini bertindak balas kepada gesaan bahasa semula jadi yang mudah dengan ketepatan dan kecanggihan yang mengagumkan. Pengguna boleh mengeluarkan arahan yang mudah seperti cari sesuatu di rak di kawasan dapur atau masuk ke bilik hiburan, belok kanan, kemudian buka pintu ke halaman, dan model dunia berperibadi secara autonomi menjana kedudukan yang sesuai, struktur rangka pergerakan, dan arahan pelaksanaan.
Visi untuk Transformasi Industri
Menurut CEO Xu Li , matlamat utama SenseTime dengan platform kecerdasan berperibadi Wu Neng melangkaui pencapaian teknologi mereka sendiri. Syarikat itu berhasrat untuk memperkasakan pelbagai perusahaan kecerdasan berperibadi merentasi industri yang berbeza, membantu mereka merealisasikan aspirasi interaksi bermakna dengan dunia sebenar. Pendekatan kolaboratif ini menunjukkan niat SenseTime untuk menetapkan platform sebagai teknologi asas yang boleh mempercepatkan inovasi merentasi ekosistem AI berperibadi yang lebih luas.
Pelancaran Wu Neng mewakili pencapaian penting dalam evolusi kecerdasan buatan berperibadi, berpotensi mempercepatkan pembangunan sistem robotik yang lebih canggih dan berkebolehan yang boleh berintegrasi dengan lancar ke dalam persekitaran dan aliran kerja manusia.