Syarikat kecerdasan buatan China DeepSeek telah membuat peralihan strategik dengan pelancaran model terbaru mereka, menandakan perubahan asas dalam cara firma AI utama mendekati keserasian perkakasan. Pelancaran DeepSeek-V3.2-Exp mewakili lebih daripada sekadar kemas kini model bahasa yang lain—ia menandakan kali pertama syarikat AI China terkemuka mengutamakan seni bina cip domestik dari hari pertama, bukannya menganggapnya sebagai pertimbangan kemudian.
Peralihan Strategik Ke Arah Kebebasan Perkakasan Domestik
DeepSeek mengumumkan model V3.2-Exp pada 29 September 2024, dengan pengoptimuman segera untuk perkakasan Ascend Huawei dan tumpukan perisian CANN . Ini mewakili penyimpangan daripada pendekatan tradisional di mana model mula-mula dioptimumkan untuk ekosistem CUDA Nvidia sebelum disesuaikan untuk platform alternatif. Syarikat ini meletakkan keluaran ini sebagai langkah perantaraan ke arah seni bina generasi akan datang kami, yang direka khusus untuk mengurangkan kos yang berkaitan dengan inferens konteks panjang melalui mekanisme perhatian jarang yang inovatif.
Ciri-Ciri Teknikal Utama
- Mekanisme Perhatian Jarang: Mengurangkan keperluan memori dan pengiraan untuk inferens konteks panjang
- Penggunaan Merentas Platform: Artifak model yang sama berfungsi merentas jenis pemecut yang berbeza dengan perubahan minimum
- Sokongan TileLang: Disyorkan untuk prototaip dan pembangunan
- Pariti vLLM: Keserasian ciri dengan rangka kerja inferens yang telah mapan semasa pelancaran
Respons Industri Berkoordinasi Menunjukkan Kematangan Ekosistem
Kelajuan penggunaan merentasi landskap semikonduktor China telah menjadi luar biasa. Pasukan Ascend Huawei bekerjasama rapat dengan komuniti vLLM-Ascend untuk memastikan keserasian segera, menerbitkan panduan pemasangan operator tersuai dan pakej kernel khusus untuk NPU Ascend . Tahap koordinasi ini menunjukkan ekosistem yang semakin matang yang dapat bertindak balas dengan pantas kepada seni bina model baharu tanpa menunggu pelaksanaan CUDA huluan.
Pelbagai Pembuat Cip Menyertai Inisiatif
Selain Huawei , syarikat semikonduktor utama China yang lain telah dengan pantas menyelaraskan platform mereka dengan model baharu. Cambricon mengeluarkan kemas kini kepada garpu vLLM-MLU mereka, mendakwa bahawa gabungan enjin inferens mereka dengan seni bina perhatian jarang V3.2-Exp mengurangkan kos pemprosesan dengan ketara untuk urutan panjang. Sementara itu, Hygon mengumumkan bahawa pemecut DCU mereka telah dioptimumkan untuk penggunaan sifar-tunggu melalui tumpukan perisian DTK mereka, menunjukkan keluasan penyertaan industri.
Platform Perkakasan yang Disokong
Syarikat | Perkakasan | Tumpukan Perisian | Status |
---|---|---|---|
Huawei | Ascend NPUs | CANN | Sokongan hari pertama dengan pengendali tersuai |
Cambricon | Pemecut MLU | vLLM-MLU | Cabang yang dikemas kini dengan pengoptimuman inferens |
Hygon | Pemecut DCU | DTK | Keupayaan penggunaan tanpa menunggu |
Nvidia | GPUs | CUDA | Keserasian yang dikekalkan |
Inovasi Teknikal Memacu Pengurangan Kos
Model V3.2-Exp menggabungkan mekanisme perhatian jarang termaju yang mengurangkan kedua-dua keperluan memori dan pengiraan sambil mengekalkan kualiti keluaran. Pendekatan teknikal ini menangani salah satu cabaran paling ketara dalam penggunaan model bahasa besar—peningkatan kos eksponen yang berkaitan dengan pemprosesan tetingkap konteks yang lebih panjang. Dokumentasi GitHub DeepSeek menunjukkan pariti ciri dengan rangka kerja yang mantap seperti vLLM pada pelancaran, mencadangkan kejuruteraan yang kukuh di sebalik penggunaan pantas.
Keserasian Merentas Platform Mengekalkan Fleksibiliti
Walaupun tumpuan pada perkakasan China, DeepSeek telah mengekalkan keserasian dengan ekosistem Nvidia . Syarikat merujuk kedua-dua kernel TileLang dan CUDA dalam dokumentasi teknikal mereka, menggalakkan penyelidik menggunakan TileLang untuk prototaip sambil memastikan artifak model yang sama boleh digunakan merentasi jenis pemecut yang berbeza dengan pengubahsuaian minimum. Pendekatan ini menyediakan fleksibiliti strategik sambil membina keupayaan domestik.
Respons Pasaran Mencerminkan Dorongan Kedaulatan AI yang Lebih Luas
Respons industri yang berkoordinasi telah menyumbang kepada sentimen pasaran yang positif, dengan Indeks Teknologi Hang Seng Hong Kong mencapai paras tertinggi empat tahun berikutan pengumuman tersebut. Komitmen kerajaan China sebanyak yuan China 500 bilion (kira-kira 71 bilion dolar Amerika Syarikat) untuk inisiatif kecerdasan buatan, yang diumumkan oleh Suruhanjaya Pembangunan dan Pembaharuan Negara , menyediakan konteks tambahan untuk kepentingan strategik keupayaan AI domestik.
Konteks Sokongan Kerajaan
- Inisiatif AI NDRC: Komitmen CNY 500 bilion (≈ USD 71 bilion) untuk kecerdasan buatan
- Subsidi Pengguna: CNY 69 bilion diagihkan kepada kerajaan tempatan daripada bon Perbendaharaan ultra-panjang
- Jumlah Tahun Hingga Kini: CNY 300 bilion dalam pelbagai langkah sokongan
Implikasi untuk Persaingan Perkakasan AI Global
Perkembangan ini mewakili petunjuk paling jelas setakat ini bahawa ekosistem AI China secara aktif bersiap sedia untuk senario di mana akses kepada perkakasan Nvidia tidak dapat dijamin. Walaupun CUDA Nvidia kekal dominan secara global, pendekatan DeepSeek untuk menganggap pemecut domestik sebagai sasaran kelas pertama bukannya pilihan sekunder boleh mempengaruhi cara syarikat AI China yang lain mendekati strategi pembangunan dan penggunaan model masa depan.