DeepSeek Melancarkan Model AI V3.2-Exp dengan Sokongan Hari Pertama untuk Cip China, Mencabar Dominasi CUDA Nvidia

Pasukan Editorial BigGo

DeepSeek Melancarkan Model AI V3.2-Exp dengan Sokongan Hari Pertama untuk Cip China, Mencabar Dominasi CUDA Nvidia

Syarikat kecerdasan buatan China DeepSeek telah membuat peralihan strategik dengan pelancaran model terbaru mereka, menandakan perubahan asas dalam cara firma AI utama mendekati keserasian perkakasan. Pelancaran DeepSeek-V3.2-Exp mewakili lebih daripada sekadar kemas kini model bahasa yang lain—ia menandakan kali pertama syarikat AI China terkemuka mengutamakan seni bina cip domestik dari hari pertama, bukannya menganggapnya sebagai pertimbangan kemudian.

Peralihan Strategik Ke Arah Kebebasan Perkakasan Domestik

DeepSeek mengumumkan model V3.2-Exp pada 29 September 2024, dengan pengoptimuman segera untuk perkakasan Ascend Huawei dan tumpukan perisian CANN . Ini mewakili penyimpangan daripada pendekatan tradisional di mana model mula-mula dioptimumkan untuk ekosistem CUDA Nvidia sebelum disesuaikan untuk platform alternatif. Syarikat ini meletakkan keluaran ini sebagai langkah perantaraan ke arah seni bina generasi akan datang kami, yang direka khusus untuk mengurangkan kos yang berkaitan dengan inferens konteks panjang melalui mekanisme perhatian jarang yang inovatif.

Ciri-Ciri Teknikal Utama

Mekanisme Perhatian Jarang: Mengurangkan keperluan memori dan pengiraan untuk inferens konteks panjang
Penggunaan Merentas Platform: Artifak model yang sama berfungsi merentas jenis pemecut yang berbeza dengan perubahan minimum
Sokongan TileLang: Disyorkan untuk prototaip dan pembangunan
Pariti vLLM: Keserasian ciri dengan rangka kerja inferens yang telah mapan semasa pelancaran

Respons Industri Berkoordinasi Menunjukkan Kematangan Ekosistem

Kelajuan penggunaan merentasi landskap semikonduktor China telah menjadi luar biasa. Pasukan Ascend Huawei bekerjasama rapat dengan komuniti vLLM-Ascend untuk memastikan keserasian segera, menerbitkan panduan pemasangan operator tersuai dan pakej kernel khusus untuk NPU Ascend . Tahap koordinasi ini menunjukkan ekosistem yang semakin matang yang dapat bertindak balas dengan pantas kepada seni bina model baharu tanpa menunggu pelaksanaan CUDA huluan.

Pelbagai Pembuat Cip Menyertai Inisiatif

Selain Huawei , syarikat semikonduktor utama China yang lain telah dengan pantas menyelaraskan platform mereka dengan model baharu. Cambricon mengeluarkan kemas kini kepada garpu vLLM-MLU mereka, mendakwa bahawa gabungan enjin inferens mereka dengan seni bina perhatian jarang V3.2-Exp mengurangkan kos pemprosesan dengan ketara untuk urutan panjang. Sementara itu, Hygon mengumumkan bahawa pemecut DCU mereka telah dioptimumkan untuk penggunaan sifar-tunggu melalui tumpukan perisian DTK mereka, menunjukkan keluasan penyertaan industri.

Platform Perkakasan yang Disokong

Syarikat	Perkakasan	Tumpukan Perisian	Status
Huawei	Ascend NPUs	CANN	Sokongan hari pertama dengan pengendali tersuai
Cambricon	Pemecut MLU	vLLM-MLU	Cabang yang dikemas kini dengan pengoptimuman inferens
Hygon	Pemecut DCU	DTK	Keupayaan penggunaan tanpa menunggu
Nvidia	GPUs	CUDA	Keserasian yang dikekalkan

Inovasi Teknikal Memacu Pengurangan Kos

Model V3.2-Exp menggabungkan mekanisme perhatian jarang termaju yang mengurangkan kedua-dua keperluan memori dan pengiraan sambil mengekalkan kualiti keluaran. Pendekatan teknikal ini menangani salah satu cabaran paling ketara dalam penggunaan model bahasa besar—peningkatan kos eksponen yang berkaitan dengan pemprosesan tetingkap konteks yang lebih panjang. Dokumentasi GitHub DeepSeek menunjukkan pariti ciri dengan rangka kerja yang mantap seperti vLLM pada pelancaran, mencadangkan kejuruteraan yang kukuh di sebalik penggunaan pantas.

Keserasian Merentas Platform Mengekalkan Fleksibiliti

Walaupun tumpuan pada perkakasan China, DeepSeek telah mengekalkan keserasian dengan ekosistem Nvidia . Syarikat merujuk kedua-dua kernel TileLang dan CUDA dalam dokumentasi teknikal mereka, menggalakkan penyelidik menggunakan TileLang untuk prototaip sambil memastikan artifak model yang sama boleh digunakan merentasi jenis pemecut yang berbeza dengan pengubahsuaian minimum. Pendekatan ini menyediakan fleksibiliti strategik sambil membina keupayaan domestik.

Respons Pasaran Mencerminkan Dorongan Kedaulatan AI yang Lebih Luas

Respons industri yang berkoordinasi telah menyumbang kepada sentimen pasaran yang positif, dengan Indeks Teknologi Hang Seng Hong Kong mencapai paras tertinggi empat tahun berikutan pengumuman tersebut. Komitmen kerajaan China sebanyak yuan China 500 bilion (kira-kira 71 bilion dolar Amerika Syarikat) untuk inisiatif kecerdasan buatan, yang diumumkan oleh Suruhanjaya Pembangunan dan Pembaharuan Negara , menyediakan konteks tambahan untuk kepentingan strategik keupayaan AI domestik.

Konteks Sokongan Kerajaan

Inisiatif AI NDRC: Komitmen CNY 500 bilion (≈ USD 71 bilion) untuk kecerdasan buatan
Subsidi Pengguna: CNY 69 bilion diagihkan kepada kerajaan tempatan daripada bon Perbendaharaan ultra-panjang
Jumlah Tahun Hingga Kini: CNY 300 bilion dalam pelbagai langkah sokongan

Implikasi untuk Persaingan Perkakasan AI Global

Perkembangan ini mewakili petunjuk paling jelas setakat ini bahawa ekosistem AI China secara aktif bersiap sedia untuk senario di mana akses kepada perkakasan Nvidia tidak dapat dijamin. Walaupun CUDA Nvidia kekal dominan secara global, pendekatan DeepSeek untuk menganggap pemecut domestik sebagai sasaran kelas pertama bukannya pilihan sekunder boleh mempengaruhi cara syarikat AI China yang lain mendekati strategi pembangunan dan penggunaan model masa depan.