Syarikat AI China DeepSeek telah mencetuskan keterujaan pasaran yang ketara dengan pelancaran model bahasa besar V3.1 nya, yang memperkenalkan standard ketepatan UE8M0 FP8 yang revolusioner yang direka khusus untuk cip domestik generasi akan datang. Pengumuman ini telah menyebabkan saham semikonduktor China melonjak tinggi, dengan syarikat seperti Cambricon mengalami keuntungan dua digit ketika pelabur menjangkakan era baharu kerjasama perisian-perkakasan dalam ekosistem AI China.
Syarikat Cip AI China Utama Yang Disebut
- Cambricon (688256): Cip MLU370-X8 dengan sokongan kuantisasi FP8
- Hygon Information (688041): Deep Computing Unit 2 (DCU) dengan prestasi 90% A100
- Moore Threads: GPU MUSA 3.1 dengan sokongan FP8 asli
- VeriSilicon: NPU VIP9000 yang menyokong operasi FP8
- Biren Technology: Cip BR104 dengan peningkatan daya pemprosesan latihan 4x ganda
Seni Bina Penaakulan Hibrid yang Revolusioner
DeepSeek V3.1 mewakili peralihan asas dalam reka bentuk model AI melalui Seni Bina Penaakulan Hibrid yang inovatif. Terobosan ini membolehkan pengguna beralih dengan lancar antara mod berfikir dan tidak berfikir dalam satu model, menghapuskan keperluan untuk bertukar antara model khusus yang berbeza. Seni bina ini mengintegrasikan keupayaan dialog am, penaakulan kompleks, dan fungsi pengaturcaraan profesional ke dalam satu sistem bersatu, meningkatkan pengalaman pengguna dan kecekapan operasi secara dramatik.
Model ini menunjukkan peningkatan kecekapan yang luar biasa, dengan prestasi mod berfikir sepadan dengan flagship sebelumnya R1-0528 sambil mengurangkan output token sebanyak 20% hingga 50%. Teknologi pemampatan rantai pemikiran ini membolehkan model menjana laluan penaakulan yang lebih ringkas tanpa mengorbankan ketepatan, menangani cabaran lama kos pengiraan tinggi yang berkaitan dengan penaakulan AI termaju.
UE8M0 FP8: Pengubah Permainan untuk Cip Domestik
Inovasi teknikal yang telah menarik perhatian industri ialah pelaksanaan ketepatan UE8M0 FP8 Scale oleh DeepSeek . Format titik terapung 8-bit ini mewakili kemajuan ketara berbanding sistem FP16 tradisional, menawarkan kecekapan pengiraan berganda sambil mengurangkan keperluan lebar jalur memori sebanyak 75%. Format UE8M0 memperuntukkan kesemua 8 bit kepada eksponen, menghapuskan bit mantissa dan tanda, yang membolehkan pemproses memulihkan data melalui anjakan bit mudah dan bukannya operasi pendaraban yang kompleks.
Standard ketepatan ini amat berfaedah untuk pemecut AI China yang sedang berkembang. Walaupun kebanyakan cip domestik semasa beroperasi pada seni bina FP16/INT8 , pemproses generasi akan datang daripada syarikat seperti Moore Threads ( MUSA 3.1 GPU ) dan VeriSilicon ( VIP9000 NPU ) sedang memasukkan sokongan FP8 asli. Penjajaran antara pengoptimuman perisian DeepSeek dan keupayaan perkakasan domestik mewujudkan sinergi berkuasa yang boleh mengurangkan pergantungan kepada sumber pengiraan asing.
UE8M0 FP8 Spesifikasi Teknikal
- Peruntukan bit: Kesemua 8 bit dikhaskan untuk eksponen (tiada bit mantissa/tanda)
- Pemulihan data: Anjakan bit mudah berbanding pendaraban kompleks
- Julat dinamik: Keupayaan dipertingkat untuk nombor besar dan kecil
- Kehilangan ketepatan: Degradasi maklumat diminimumkan
- Keserasian perkakasan: Dioptimumkan untuk cip AI China generasi akan datang
Respons Pasaran dan Kesan Industri
Pengumuman itu mencetuskan reaksi pasaran serta-merta, dengan saham konsep cip China mengalami keuntungan besar. Daily Interactive melonjak 13.62% dalam dagangan lewat, manakala syarikat semikonduktor lain menyaksikan momentum menaik yang serupa. Pemerhati industri menyatakan bahawa kenyataan tunggal DeepSeek tentang cip domestik generasi akan datang mengandungi maklumat yang cukup untuk mencetuskan spekulasi meluas tentang trajektori kemerdekaan AI China.
Keghairahan pasaran mencerminkan jangkaan yang lebih luas bahawa kerjasama perisian-perkakasan ini boleh memecahkan paradigma tradisional prestasi tinggi sama dengan kos tinggi dalam aplikasi AI. Perkhidmatan kewangan, penjagaan kesihatan, dan senario pengiraan tinggi lain yang sebelum ini tidak mampu dari segi kos kini mungkin menjadi berdaya maju dari segi ekonomi, membuka peluang komersial baharu merentasi pelbagai sektor.
Prestasi Teknikal dan Aplikasi Dunia Sebenar
Ujian komuniti telah mendedahkan metrik prestasi yang mengagumkan untuk DeepSeek V3.1 . Dalam ujian pengaturcaraan pelbagai bahasa Aider , model ini melebihi skor Claude 4 Opus sambil mengekalkan kos operasi yang lebih rendah. Keupayaan simulasi fizik yang diperbaiki menunjukkan pemodelan dunia sebenar yang lebih tepat, dengan pengendalian parameter graviti, geseran, putaran, dan lantunan yang dipertingkatkan.
Walau bagaimanapun, sesetengah pengguna telah melaporkan ketidakkonsistenan dalam tugasan terjemahan dan penulisan, menyatakan output bahasa bercampur sekali-sekala dan ralat perkataan yang memerlukan kejuruteraan gesaan manual untuk diselesaikan. Batasan ini menunjukkan bahawa walaupun model ini cemerlang dalam aplikasi penaakulan dan pengaturcaraan, penambahbaikan dalam pemprosesan bahasa masih berterusan.
Peningkatan Prestasi DeepSeek V3.1
Metrik | Peningkatan |
---|---|
Pengurangan output token (mod pemikiran) | 20-50% |
Kecekapan pengkomputeran berbanding FP16 | Peningkatan 2x |
Pengurangan lebar jalur memori | 75% |
Peningkatan ketumpatan pengkomputeran Cambricon MLU370-X8 | 40% |
Pengurangan penggunaan kuasa | 50% |
Implikasi Strategik untuk Ekosistem AI China
Pelancaran DeepSeek V3.1 menandakan titik peralihan kritikal untuk industri AI China, beralih daripada pergantungan perkakasan ke arah penyelesaian domestik bersepadu. Standard UE8M0 FP8 mewakili lebih daripada pengoptimuman teknikal—ia mewujudkan asas untuk syarikat China membangunkan aplikasi AI tanpa bergantung berat kepada seni bina semikonduktor asing.
Pakar industri mencadangkan perkembangan ini boleh mempercepatkan garis masa untuk penggunaan AI berskala besar di China, terutamanya dalam sektor di mana sensitiviti kos telah mengehadkan penggunaan. Gabungan kecekapan yang diperbaiki dan keserasian perkakasan domestik meletakkan syarikat AI China untuk bersaing dengan lebih berkesan dalam pasaran global sambil mengekalkan kedaulatan teknologi.
Kejayaan pendekatan integrasi perisian-perkakasan ini mungkin mempengaruhi syarikat AI China lain untuk meneruskan strategi yang serupa, berpotensi mewujudkan dinamik persaingan baharu dalam landskap kecerdasan buatan global. Ketika DeepSeek meneruskan pembangunan ke arah model R2 yang dijangkakan, industri akan memantau dengan teliti sama ada model kerjasama domestik ini dapat mengekalkan momentum awalnya dan memenuhi janji komersialnya.