Dalam langkah yang berpotensi mengubah landskap persaingan kecerdasan buatan, firma AI China DeepSeek telah melancarkan siri model V3.2 secara rasmi. Pelancaran ini mewakili peningkatan ketara dalam pertarungan berterusan antara AI sumber terbuka dan proprietari, dengan menawarkan keupayaan penaakulan dan agen maju pada titik harga yang jauh lebih rendah berbanding peneraju industri. Pelancaran ini menyusul versi eksperimen yang diumumkan pada Oktober dan berlaku ketika komuniti AI semakin mempersoalkan sama ada jurang prestasi antara model percuma dan model sumber tertutup benar-benar tidak dapat diatasi.
Pelancaran Rasmi dan Varian Model
DeepSeek telah mengeluarkan dua versi berbeza bagi model V3.2: DeepSeek-V3.2 standard dan DeepSeek-V3.2-Speciale yang lebih berkuasa. Versi standard kini tersedia di semua saluran rasmi, termasuk antara muka web syarikat, aplikasi mudah alih, dan perkhidmatan API. Ini merupakan model DeepSeek pertama yang mengintegrasikan "pemikiran" secara langsung ke dalam keupayaan penggunaan alatnya, menyokong kedua-dua mod pemikiran dan bukan pemikiran untuk panggilan alat. Bagaimanapun, varian Speciale kini hanya ditawarkan sebagai perkhidmatan API sementara, yang diposisikan secara eksplisit untuk tujuan penilaian komuniti dan penyelidikan. Strategi pelancaran berperingkat ini membolehkan DeepSeek mengumpul maklum balas dunia sebenar mengenai model paling majunya sambil menjadikan teknologi teras boleh diakses serta-merta kepada pembangun.
Varian Model & Ketersediaan
- DeepSeek-V3.2 (Standard): Secara umumnya tersedia di laman web rasmi, Apl, dan API.
- DeepSeek-V3.2-Speciale: Hanya tersedia sebagai API sementara untuk penilaian/penyelidikan komuniti.
Prestasi yang Didakwa berbanding Model Proprietari
- Mengatasi prestasi dalam beberapa penanda aras: OpenAI GPT-5 High, Anthropic Claude 4.5 Sonnet, Google Gemini 3.0 Pro.
- Pencapaian Akademik: Prestasi peringkat emas dalam Olimpik Matematik Antarabangsa (IMO) dan Olimpik Antarabangsa dalam Informatik.
Perbandingan Harga (per 1 juta token)
| Model | Kos API |
|---|---|
| DeepSeek V3.2 Speciale | USD 0.028 |
| Google Gemini 3 | Sehingga USD 4.00 |
Inovasi Teknikal
- Masalah Teras yang Dikenal pasti: Model sumber terbuka bergantung pada "perhatian vanila" yang perlahan dan memerlukan banyak pengiraan.
- Penyelesaian: DeepSeek Sparse Attention (DSA) menggunakan "pengindeks kilat" dua fasa untuk mencari token yang relevan sebelum menggunakan pengiraan penuh, meningkatkan kecekapan secara drastik.
- Latihan: Menggunakan model "tutor" pakar untuk pasca-latihan merentasi penulisan, matematik, pengaturcaraan, dan tugasan agen.
Batasan yang Diakui Pengetahuan dunia yang lebih terhad berbanding model proprietari terkini. Memerlukan lebih banyak token untuk menyamai kualiti output.
- Bergelut dengan tugasan yang lebih kompleks.
Prestasi Setanding Peneraju
Tuntutan prestasi mengenai V3.2, terutamanya edisi Speciale, adalah berani. Menurut data yang diterbitkan oleh DeepSeek, model ini bersaing secara langsung dengan generasi semasa sistem proprietari peringkat teratas. Syarikat menyatakan bahawa V3.2 Speciale mengatasi model seperti GPT-5 High OpenAI, Claude 4.5 Sonnet Anthropic, dan Gemini 3.0 Pro Google pada penanda aras penaakulan tertentu. Ia juga telah mencapai prestasi peringkat emas dalam pertandingan akademik berprestij, termasuk Olimpiad Matematik Antarabangsa (IMO) dan Olimpiad Antarabangsa dalam Informatik. Pencapaian ini membina reputasi yang ditubuhkan DeepSeek lebih awal tahun ini dengan model R1nya, sebuah AI penaakulan sumber terbuka yang mengatasi o1 OpenAI pada beberapa penanda aras utama. Corak konsisten prestasi kompetitif ini mencabar naratif bahawa model proprietari memegang kelebangan keupayaan yang tidak dapat ditandingi.
Kelebihan Kos Yang Mengejutkan
Mungkin aspek paling mengganggu pelancaran V3.2 adalah penetapan harganya. DeepSeek telah mengekalkan strateginya untuk mengurangkan kos secara mendadak dengan setiap lelaran model. Mengakses model V3.2 Speciale melalui API hanya berharga 0.028 dolar Amerika Syarikat bagi setiap 1 juta token. Sebagai perbandingan, menggunakan Gemini 3 Google melalui API boleh menelan kos sehingga 4.00 dolar Amerika Syarikat untuk jumlah yang sama. Ini mewakili perbezaan kos lebih daripada 140 kali ganda. Dalam kertas penyelidikan, DeepSeek memposisikan V3.2 sebagai "alternatif yang sangat cekap kos dalam senario agen," dengan berhujah ia "mengecilkan jurang prestasi antara model sumber terbuka dan proprietari peneraju dengan ketara sambil menanggung kos yang jauh lebih rendah." Penetapan harga agresif ini secara langsung mengancam rasional ekonomi di sebalik pelaburan besar-besaran yang dibuat oleh makmal AI proprietari, berpotensi melemahkan proposisi nilai asas mereka kepada pembangun dan perusahaan.
Inovasi Teknikal: Bekerja Dengan Lebih Bijak, Bukan Lebih Keras
Pendekatan teknikal DeepSeek untuk merapatkan jurang prestasi memfokuskan pada mendiagnosis kelemahan khusus dalam seni bina sumber terbuka. Syarikat mengenal pasti tiga isu teras: kebergantungan pada mekanisme "perhatian vanila" yang tidak cekap, fasa pasca-latihan yang terhad dari segi pengiraan, dan kesukaran dengan generalisasi tugas dan pematuhan arahan panjang. Sebagai tindak balas, mereka membangunkan DeepSeek Sparse Attention (DSA). Mekanisme novel ini beroperasi dalam dua fasa untuk mengurangkan kerumitan pengiraan. Pertama, "pengindeks kilat" melakukan imbasan peringkat tinggi untuk mengenal pasti token paling relevan daripada data latihannya untuk pertanyaan tertentu. Ia kemudiannya menggunakan kuasa pengiraan penuhnya hanya pada subset yang ditapis ini. Syarikat menyamakan ini dengan beralih daripada mencari ayat dalam timbunan buku gergasi yang berselerak kepada mencarinya di perpustakaan yang tersusun rapi—proses yang jauh lebih cekap. Untuk menangani batasan pasca-latihan, DeepSeek membina satu suite model "pakar" untuk mengajar dan memperhalusi keupayaan V3.2 merentasi domain pelbagai seperti penulisan, matematik, pengaturcaraan, dan tugas agen.
Batasan Yang Diakui dan Jalan Ke Hadapan
Walaupun pencapaiannya, DeepSeek telus mengenai kelemahan semasa V3.2. "Pengetahuan dunia" model—pemahaman praktikal yang disimpulkan daripada data latihan—dicatatkan sebagai lebih terhad berbanding model proprietari terkemuka. Ia juga memerlukan lebih banyak token untuk menjana output berkualiti setanding dan bergelut dengan tugas yang sangat kompleks. Syarikat mengakui jurang ini dan menggariskan jalan ke hadapan yang memfokuskan pada meningkatkan kuasa pengiraan semasa pra-latihan dan memperhalusi "resipi pasca-latihan"nya. Batasan ini menyerlahkan bahawa perlumbaan belum selesai, tetapi ia juga membingkaikan jurang prestasi sebagai cabaran teknikal untuk diselesaikan, bukan ciri kekal landskap AI. Tindakan mengenal pasti dan menangani kelemahan ini secara terbuka adalah sebahagian daripada falsafah pembangunan lelaran model sumber terbuka.
Implikasi untuk Masa Depan Industri AI
Keluaran DeepSeek V3.2 membawa implikasi mendalam yang melangkaui pelancaran produk tunggal. Ia memberikan bukti yang semakin berkembang bahawa perbezaan antara AI sumber terbuka dan sumber tertutup bukanlah undang-undang tetap tetapi percanggahan yang boleh dirapatkan melalui inovasi dalam bidang seperti mekanisme perhatian dan metodologi latihan. Lebih penting lagi, dengan menawarkan model yang mempunyai keupayaan penaakulan kompetitif pada kos hampir sifar untuk pembangun akses dan bina, DeepSeek mencabar model perniagaan teras AI proprietari. Jika trajektori berterusan dan model sumber terbuka mula mengatasi model proprietari dalam bidang utama, justifikasi untuk membayar harga premium untuk alat sumber tertutup berkurangan dengan ketara. Pelancaran ini memanaskan perlumbaan, memaksa seluruh industri untuk mempertimbangkan semula keseimbangan antara keterbukaan, prestasi, dan kos dalam era seterusnya kecerdasan buatan.
