DeepSeek Melancarkan Model AI V3.1 dengan Seni Bina Penaakulan Hibrid dan Kenaikan Harga

Pasukan Editorial BigGo

DeepSeek Melancarkan Model AI V3.1 dengan Seni Bina Penaakulan Hibrid dan Kenaikan Harga

Syarikat penyelidikan AI China DeepSeek telah secara rasmi memperkenalkan model sumber terbuka terbaharunya, DeepSeek-V3.1 , menandakan kemajuan ketara dalam keupayaan kecerdasan buatan sambil mengumumkan kenaikan harga yang besar untuk perkhidmatan API nya. Pelancaran ini mewakili lebih daripada sekadar peningkatan parameter dari 671 bilion kepada 685 bilion parameter—ia memperkenalkan seni bina penaakulan hibrid yang revolusioner yang boleh membentuk semula cara sistem AI berinteraksi dengan pengguna dan mengendalikan tugas-tugas kompleks.

Seni Bina Penaakulan Hibrid yang Revolusioner

DeepSeek-V3.1 memperkenalkan seni bina penaakulan hibrid yang pertama dalam industri yang membolehkan satu model bertukar dengan lancar antara mod pemikiran (deepseek-reasoner) dan mod bukan pemikiran (deepseek-chat). Pengguna boleh bertukar antara mod ini melalui aplikasi rasmi atau antara muka web menggunakan butang pemikiran mendalam. Mod bukan pemikiran menyasarkan pertanyaan mudah seperti cuaca atau soalan ensiklopedia, menyampaikan hasil yang diperkemas dengan masa respons 20% lebih pantas. Sementara itu, mod pemikiran menangani masalah kompleks seperti pembuktian matematik dan penyahpepijatan kod dengan mengaktifkan rantai penaakulan dalaman yang mendalam, menghasilkan logik yang lebih ketat dengan kos respons yang sedikit lebih perlahan.

Peningkatan Kecekapan Melalui Pemampatan Rantai Pemikiran

Model baharu ini menunjukkan peningkatan kecekapan yang luar biasa melalui latihan pemampatan rantai pemikiran yang canggih. DeepSeek-V3.1 mengekalkan tahap prestasi yang setanding dengan pendahulunya R1-0528 sambil mengurangkan penjanaan token keluaran sebanyak 20-50%. Tugas yang sebelum ini memerlukan 1000 token kini boleh diselesaikan dengan hanya 500 token sambil mengekalkan kualiti keluaran yang setara. Peningkatan kecekapan ini diterjemahkan kepada kos pengiraan yang jauh lebih rendah dan kependaman respons yang berkurangan, menjadikan teknologi ini lebih mudah diakses untuk penggunaan meluas.

Penanda Aras Prestasi

Ujian	Skor DeepSeek-V3.1	Skor Model Terdahulu
Matematik AIME 2015	87.5/100	88.4/100
Sains GPQA	81/100	80.1/100
liveCodeBench	73.3/100	74.8/100
Pengurangan Token	20-50% lebih sedikit	Garis Dasar

Spesifikasi Teknikal dan Penanda Aras Prestasi

Dibina atas seni bina Mixture-of-Experts (MoE) , DeepSeek-V3.1 dengan 685 bilion parameter mengaktifkan hanya 37 bilion parameter setiap token, mencapai keseimbangan optimum antara kecekapan dan prestasi. Model ini menyokong pelbagai format tensor termasuk BF16, FP8 (F8_E4M3), dan F32, memberikan pembangun fleksibiliti pengoptimuman perkakasan. Model asas menjalani latihan tambahan dengan 840 bilion token melebihi asas V3, memperluaskan keupayaan pemprosesan konteks panjangnya kepada 128K token—bersamaan dengan kira-kira 130,000 aksara Cina atau 80 bab pertama Dream of the Red Chamber .

Perbandingan Spesifikasi Model

Ciri	DeepSeek-V3	DeepSeek-V3.1
Jumlah Parameter	671 bilion	685 bilion
Parameter Aktif per Token	37 bilion	37 bilion
Tetingkap Konteks	128K token	128K token
Latihan Tambahan	-	840B token
Piawaian Ketepatan	Standard FP8	UE8M0 FP8
Seni Bina	MoE	Hybrid MoE

Penggunaan Strategik Standard UE8M0 FP8

Mungkin yang paling penting untuk landskap AI global, DeepSeek-V3.1 menggunakan standard ketepatan UE8M0 FP8 yang direka khusus untuk cip domestik China generasi akan datang. Keputusan teknikal ini mewakili penyimpangan strategik daripada standard E4M3/E5M2 FP8 NVIDIA , berpotensi mewujudkan dua laluan ekosistem AI yang berbeza. Format UE8M0 mengutamakan penggunaan kuasa yang lebih rendah dan pengiraan yang lebih pantas berbanding ketepatan yang lebih tinggi yang ditawarkan oleh standard NVIDIA , menjadikannya lebih sesuai untuk seni bina cip domestik dengan falsafah reka bentuk yang berbeza.

Pelarasan Harga API yang Besar

Bersamaan dengan pengumuman teknikal, DeepSeek mendedahkan perubahan harga yang ketara berkuat kuasa 6 September. Harga input untuk cache miss akan meningkat daripada yuan China ¥2 kepada ¥4 setiap juta token, manakala harga keluaran meningkat daripada ¥8 kepada ¥12 setiap juta token. Syarikat juga menghapuskan diskaun harga waktu malam. Pelarasan ini mencerminkan pelaburan penyelidikan dan pembangunan yang besar yang diperlukan untuk peningkatan V3.1, termasuk latihan tambahan 840 bilion token dan penyesuaian ketepatan UE8M0 FP8 untuk keserasian cip domestik.

Perubahan Harga API (Berkuat kuasa 6 September 2025)

Jenis Perkhidmatan	Harga Terdahulu	Harga Baharu	Perubahan
Input (cache miss)	¥2/juta token	¥4/juta token	+100%
Input (cache hit)	¥0.5/juta token	¥0.5/juta token	Tiada perubahan
Output	¥8/juta token	¥12/juta token	+50%
Diskaun Waktu Malam	Tersedia	Dihapuskan	Dibuang

Impak Pasaran dan Implikasi Industri

Pelancaran ini telah menjana respons pasaran yang ketara, dengan saham berkaitan AI mengalami keuntungan yang notable. Syarikat seperti Cambricon , yang menghasilkan cip AI yang serasi dengan teknologi DeepSeek , menyaksikan peningkatan intrahari hampir 14%. Lesen MIT sumber terbuka model dan pengoptimuman API dijangka mempercepatkan penggunaan ejen AI merentas sektor kewangan, perubatan, dan automasi pejabat. Penganalisis industri meramalkan pasaran ejen AI boleh mencapai yuan China ¥852 bilion menjelang 2028, dengan kadar pertumbuhan tahunan kompaun 72.7%.

Impak Pasaran Saham (Hari Pengumuman)

Cambricon (688256.SH): Keuntungan +14% dalam hari
Kunlun Wanwei (300418.SZ): Keuntungan +10%
Hanvon Ugee (300170.SZ): Dagangan aktif dalam konsep ejen AI
iFlytek (002230.SZ): Prestasi +35% dari awal tahun hingga kini
Wondershare (300624.SZ): Keuntungan tahunan +80%, pertumbuhan keuntungan +42%

Masa Depan Persaingan Ekosistem AI

Pilihan strategik DeepSeek dengan V3.1 menandakan peralihan yang lebih luas dalam landskap AI global. Dengan menggunakan standard teknikal domestik dan menunjukkan bahawa keupayaan AI canggih tidak memerlukan sumber pengiraan yang besar, syarikat itu meletakkan dirinya sebagai pemimpin dalam laluan pembangunan prestasi tinggi yang ringan. Pendekatan ini memberikan peluang kepada pembangun kecil di seluruh dunia untuk mengambil bahagian dalam inovasi AI sambil berpotensi mewujudkan ekosistem AI selari berdasarkan asas teknikal yang berbeza dan pertimbangan geopolitik.