Syarikat penyelidikan AI China DeepSeek telah secara rasmi memperkenalkan model sumber terbuka terbaharunya, DeepSeek-V3.1 , menandakan kemajuan ketara dalam keupayaan kecerdasan buatan sambil mengumumkan kenaikan harga yang besar untuk perkhidmatan API nya. Pelancaran ini mewakili lebih daripada sekadar peningkatan parameter dari 671 bilion kepada 685 bilion parameter—ia memperkenalkan seni bina penaakulan hibrid yang revolusioner yang boleh membentuk semula cara sistem AI berinteraksi dengan pengguna dan mengendalikan tugas-tugas kompleks.
Seni Bina Penaakulan Hibrid yang Revolusioner
DeepSeek-V3.1 memperkenalkan seni bina penaakulan hibrid yang pertama dalam industri yang membolehkan satu model bertukar dengan lancar antara mod pemikiran (deepseek-reasoner) dan mod bukan pemikiran (deepseek-chat). Pengguna boleh bertukar antara mod ini melalui aplikasi rasmi atau antara muka web menggunakan butang pemikiran mendalam. Mod bukan pemikiran menyasarkan pertanyaan mudah seperti cuaca atau soalan ensiklopedia, menyampaikan hasil yang diperkemas dengan masa respons 20% lebih pantas. Sementara itu, mod pemikiran menangani masalah kompleks seperti pembuktian matematik dan penyahpepijatan kod dengan mengaktifkan rantai penaakulan dalaman yang mendalam, menghasilkan logik yang lebih ketat dengan kos respons yang sedikit lebih perlahan.
Peningkatan Kecekapan Melalui Pemampatan Rantai Pemikiran
Model baharu ini menunjukkan peningkatan kecekapan yang luar biasa melalui latihan pemampatan rantai pemikiran yang canggih. DeepSeek-V3.1 mengekalkan tahap prestasi yang setanding dengan pendahulunya R1-0528 sambil mengurangkan penjanaan token keluaran sebanyak 20-50%. Tugas yang sebelum ini memerlukan 1000 token kini boleh diselesaikan dengan hanya 500 token sambil mengekalkan kualiti keluaran yang setara. Peningkatan kecekapan ini diterjemahkan kepada kos pengiraan yang jauh lebih rendah dan kependaman respons yang berkurangan, menjadikan teknologi ini lebih mudah diakses untuk penggunaan meluas.
Penanda Aras Prestasi
Ujian | Skor DeepSeek-V3.1 | Skor Model Terdahulu |
---|---|---|
Matematik AIME 2015 | 87.5/100 | 88.4/100 |
Sains GPQA | 81/100 | 80.1/100 |
liveCodeBench | 73.3/100 | 74.8/100 |
Pengurangan Token | 20-50% lebih sedikit | Garis Dasar |
Spesifikasi Teknikal dan Penanda Aras Prestasi
Dibina atas seni bina Mixture-of-Experts (MoE) , DeepSeek-V3.1 dengan 685 bilion parameter mengaktifkan hanya 37 bilion parameter setiap token, mencapai keseimbangan optimum antara kecekapan dan prestasi. Model ini menyokong pelbagai format tensor termasuk BF16, FP8 (F8_E4M3), dan F32, memberikan pembangun fleksibiliti pengoptimuman perkakasan. Model asas menjalani latihan tambahan dengan 840 bilion token melebihi asas V3, memperluaskan keupayaan pemprosesan konteks panjangnya kepada 128K token—bersamaan dengan kira-kira 130,000 aksara Cina atau 80 bab pertama Dream of the Red Chamber .
Perbandingan Spesifikasi Model
Ciri | DeepSeek-V3 | DeepSeek-V3.1 |
---|---|---|
Jumlah Parameter | 671 bilion | 685 bilion |
Parameter Aktif per Token | 37 bilion | 37 bilion |
Tetingkap Konteks | 128K token | 128K token |
Latihan Tambahan | - | 840B token |
Piawaian Ketepatan | Standard FP8 | UE8M0 FP8 |
Seni Bina | MoE | Hybrid MoE |
Penggunaan Strategik Standard UE8M0 FP8
Mungkin yang paling penting untuk landskap AI global, DeepSeek-V3.1 menggunakan standard ketepatan UE8M0 FP8 yang direka khusus untuk cip domestik China generasi akan datang. Keputusan teknikal ini mewakili penyimpangan strategik daripada standard E4M3/E5M2 FP8 NVIDIA , berpotensi mewujudkan dua laluan ekosistem AI yang berbeza. Format UE8M0 mengutamakan penggunaan kuasa yang lebih rendah dan pengiraan yang lebih pantas berbanding ketepatan yang lebih tinggi yang ditawarkan oleh standard NVIDIA , menjadikannya lebih sesuai untuk seni bina cip domestik dengan falsafah reka bentuk yang berbeza.
Pelarasan Harga API yang Besar
Bersamaan dengan pengumuman teknikal, DeepSeek mendedahkan perubahan harga yang ketara berkuat kuasa 6 September. Harga input untuk cache miss akan meningkat daripada yuan China ¥2 kepada ¥4 setiap juta token, manakala harga keluaran meningkat daripada ¥8 kepada ¥12 setiap juta token. Syarikat juga menghapuskan diskaun harga waktu malam. Pelarasan ini mencerminkan pelaburan penyelidikan dan pembangunan yang besar yang diperlukan untuk peningkatan V3.1, termasuk latihan tambahan 840 bilion token dan penyesuaian ketepatan UE8M0 FP8 untuk keserasian cip domestik.
Perubahan Harga API (Berkuat kuasa 6 September 2025)
Jenis Perkhidmatan | Harga Terdahulu | Harga Baharu | Perubahan |
---|---|---|---|
Input (cache miss) | ¥2/juta token | ¥4/juta token | +100% |
Input (cache hit) | ¥0.5/juta token | ¥0.5/juta token | Tiada perubahan |
Output | ¥8/juta token | ¥12/juta token | +50% |
Diskaun Waktu Malam | Tersedia | Dihapuskan | Dibuang |
Impak Pasaran dan Implikasi Industri
Pelancaran ini telah menjana respons pasaran yang ketara, dengan saham berkaitan AI mengalami keuntungan yang notable. Syarikat seperti Cambricon , yang menghasilkan cip AI yang serasi dengan teknologi DeepSeek , menyaksikan peningkatan intrahari hampir 14%. Lesen MIT sumber terbuka model dan pengoptimuman API dijangka mempercepatkan penggunaan ejen AI merentas sektor kewangan, perubatan, dan automasi pejabat. Penganalisis industri meramalkan pasaran ejen AI boleh mencapai yuan China ¥852 bilion menjelang 2028, dengan kadar pertumbuhan tahunan kompaun 72.7%.
Impak Pasaran Saham (Hari Pengumuman)
- Cambricon (688256.SH): Keuntungan +14% dalam hari
- Kunlun Wanwei (300418.SZ): Keuntungan +10%
- Hanvon Ugee (300170.SZ): Dagangan aktif dalam konsep ejen AI
- iFlytek (002230.SZ): Prestasi +35% dari awal tahun hingga kini
- Wondershare (300624.SZ): Keuntungan tahunan +80%, pertumbuhan keuntungan +42%
Masa Depan Persaingan Ekosistem AI
Pilihan strategik DeepSeek dengan V3.1 menandakan peralihan yang lebih luas dalam landskap AI global. Dengan menggunakan standard teknikal domestik dan menunjukkan bahawa keupayaan AI canggih tidak memerlukan sumber pengiraan yang besar, syarikat itu meletakkan dirinya sebagai pemimpin dalam laluan pembangunan prestasi tinggi yang ringan. Pendekatan ini memberikan peluang kepada pembangun kecil di seluruh dunia untuk mengambil bahagian dalam inovasi AI sambil berpotensi mewujudkan ekosistem AI selari berdasarkan asas teknikal yang berbeza dan pertimbangan geopolitik.