NVIDIA secara senyap-senyap telah melancarkan keluarga baru model AI penaakulan yang dipanggil OpenReasoning-Nemotron, menandakan perubahan ketara dalam pendekatan syarikat terhadap pembangunan AI sumber terbuka. Walaupun pengumuman asal memfokuskan kepada keluarga Llama Nemotron, pelepasan sebenar mendedahkan asas teknikal yang berbeza dan telah menarik perhatian komuniti AI.
Model yang Dibina atas Seni Bina DeepSeek R1
Aspek yang paling menarik dalam pelepasan ini ialah model OpenReasoning-Nemotron NVIDIA sebenarnya disuling daripada model R1 0528 DeepSeek yang besar dengan 671 bilion parameter, bukannya dibina atas seni bina Llama Meta seperti yang dicadangkan pada mulanya. Ini mewakili penyimpangan ketara daripada kerjasama terdahulu NVIDIA dan menyerlahkan pengaruh yang semakin berkembang bagi keupayaan penaakulan DeepSeek dalam landskap AI.
Keluarga model ini merangkumi empat varian dengan parameter 1.5B, 7B, 14B, dan 32B, setiap satu direka untuk memenuhi keperluan pengiraan yang berbeza dan senario penggunaan. Julat ini membolehkan pembangun memilih saiz model yang sesuai berdasarkan kekangan perkakasan khusus dan keperluan prestasi mereka.
DeepSeek R1: Model bahasa besar yang dibangunkan oleh syarikat AI China DeepSeek, terkenal dengan keupayaan penaakulan yang kuat dan kiraan parameter yang besar.
Varian Model OpenReasoning-Nemotron:
- 1.5B parameter - Dioptimumkan untuk peranti pinggir dan PC
- 7B parameter - Prestasi seimbang untuk penggunaan GPU tunggal
- 14B parameter - Penaakulan dipertingkat untuk pelayan julat pertengahan
- 32B parameter - Ketepatan maksimum untuk sistem perusahaan multi-GPU
Respons Komuniti dan Butiran Teknikal
Komuniti pembangunan AI telah menunjukkan reaksi bercampur-campur terhadap masa pelepasan dan spesifikasi teknikal. Sesetengah pembangun telah mencatatkan kekeliruan antara pengumuman Mac yang asal dan pelepasan semasa, mencadangkan bahawa komunikasi NVIDIA mengenai pelancaran produk ini kurang jelas.
Akses kepada model memerlukan pengesahan melalui platform binaan NVIDIA, yang telah mewujudkan sedikit geseran bagi pembangun yang tidak sabar untuk bereksperimen dengan keupayaan penaakulan baharu. Model-model tersebut boleh didapati melalui saluran rasmi NVIDIA dan Hugging Face, menyediakan pelbagai laluan untuk integrasi ke dalam aliran kerja AI sedia ada.
Asas Teknikal:
- Disuling daripada DeepSeek R1 0528 (671B parameter)
- Tersedia melalui NVIDIA build.nvidia.com dan Hugging Face
- Memerlukan pengesahan untuk akses model
- Sebahagian daripada platform perisian NVIDIA AI Enterprise
Tuntutan Prestasi dan Aplikasi Dunia Sebenar
NVIDIA mendakwa model baharu memberikan ketepatan sehingga 20% lebih baik berbanding model asas dan mencapai kelajuan inferens 5 kali lebih pantas daripada model penaakulan terbuka yang bersaing. Peningkatan prestasi ini boleh memberi kesan ketara kepada penggunaan perusahaan, terutamanya dalam senario yang memerlukan pembuatan keputusan kompleks dan tugas penaakulan berbilang langkah.
Syarikat telah meletakkan model-model ini sebagai alat asas untuk membina sistem AI agentik - agen AI autonomi yang boleh bekerja secara bebas atau dalam pasukan untuk menyelesaikan masalah kompleks. Ini sejajar dengan trend industri yang lebih luas ke arah aplikasi AI yang lebih canggih yang boleh mengendalikan cabaran perniagaan dunia sebenar dengan campur tangan manusia yang minimum.
Pelepasan OpenReasoning-Nemotron mewakili dorongan berterusan NVIDIA ke dalam landskap kompetitif model AI penaakulan. Walaupun asas teknikal mungkin berbeza daripada pengumuman awal, fokus kepada aplikasi perusahaan praktikal dan metrik prestasi yang diperbaiki menunjukkan model-model ini boleh memainkan peranan penting dalam fasa seterusnya penggunaan AI merentasi industri.