MiniMax Melancarkan Model Penaakulan M1 untuk Mencabar DeepSeek dengan Konteks 1 Juta Token dan Kos Latihan Ultra Rendah

Pasukan Editorial BigGo
MiniMax Melancarkan Model Penaakulan M1 untuk Mencabar DeepSeek dengan Konteks 1 Juta Token dan Kos Latihan Ultra Rendah

Syarikat permulaan AI China MiniMax telah memasuki arena model penaakulan yang kompetitif dengan cabaran berani kepada peneraju industri DeepSeek . Pengumuman terbaru syarikat ini menandakan pencapaian penting dalam perlumbaan berterusan antara enam syarikat AI besar China untuk membangunkan keupayaan penaakulan canggih yang boleh bersaing dengan peneraju global.

Terobosan Revolusioner dalam Panjang Konteks dan Kecekapan

Model M1 daripada MiniMax memperkenalkan keupayaan terobosan dengan sokongan untuk input konteks 1 juta token, menyamai Google Gemini 2.5 Pro dan mewakili peningkatan 8 kali ganda berbanding kapasiti DeepSeek R1 . Model ini juga menyokong sehingga 80,000 token untuk output penaakulan, menetapkan piawaian industri baharu untuk pemprosesan konteks panjang. Pencapaian ini berpunca daripada mekanisme Lightning Attention proprietari MiniMax , pendekatan novel untuk mengira matriks perhatian yang mengurangkan overhed pengiraan dengan ketara semasa fasa latihan dan inferens.

Spesifikasi Utama MiniMax M1

  • Input Konteks: 1,000,000 token (8x DeepSeek R1)
  • Output Penaakulan: 80,000 token
  • Kos Latihan: USD 534,700 (512 GPU H800, 3 minggu)
  • Seni Bina: Mixed MoE dengan mekanisme Lightning Attention
  • Algoritma: Pembelajaran pekukuhan CISPO (penumpuan 2x lebih pantas daripada DAPO)

Latihan Kos Efektif Melalui Inovasi Teknikal

Syarikat mencapai kecekapan kos yang luar biasa dalam pembangunan model, menyelesaikan keseluruhan fasa pembelajaran pengukuhan menggunakan hanya 512 GPU H800 selama tiga minggu dengan kos sewa hanya 534,700 dolar Amerika. Ini mewakili pengurangan sepuluh kali ganda daripada unjuran awal, menunjukkan keberkesanan inovasi teknikal MiniMax . Terobosan ini dicapai melalui algoritma pembelajaran pengukuhan CISPO yang baru dibangunkan, yang mengoptimumkan wajaran pensampelan kepentingan berbanding kemas kini token tradisional, menghasilkan kelajuan konvergensi dua kali lebih pantas daripada pendekatan pesaing termasuk algoritma DAPO terbaru ByteDance .

Prestasi Kompetitif Merentas Penanda Aras Industri

Ujian menyeluruh merentas 17 set data penilaian arus perdana mendedahkan kedudukan kompetitif kukuh M1 dalam pasaran. Model ini menunjukkan prestasi setanding dengan DeepSeek R1 dan Qwen3 dalam pelbagai ujian penanda aras, sambil menghampiri keupayaan model O3 OpenAI . Yang paling ketara ialah prestasi unggul M1 dalam senario penggunaan alat ejen melalui penilaian TAU-bench , di mana ia mengatasi Google Gemini 2.5 Pro walaupun sedikit ketinggalan dalam tugas pemahaman konteks panjang umum.

Penanda Aras Prestasi

  • 17 set data penilaian arus perdana telah diuji
  • Prestasi setanding dengan DeepSeek R1 dan Qwen3
  • Menghampiri keupayaan OpenAI O3
  • Mengatasi Gemini 2.5 Pro dalam TAU-bench (penggunaan alat ejen)
  • Sedikit ketinggalan daripada Gemini 2.5 Pro dalam pemahaman konteks panjang

Penetapan Harga Strategik untuk Penembusan Pasaran

MiniMax telah melaksanakan struktur harga berperingkat yang direka untuk memaksimumkan kebolehcapaian sambil mengekalkan kelebihan daya saing. Untuk panjang konteks 0-32k token, syarikat mengenakan 0.8 yuan China setiap juta token input dan 8 yuan China setiap juta token output. Julat 32k-128k berharga 1.2 yuan China untuk input dan 16 yuan China untuk output setiap juta token, manakala julat maksimum 128k-1M dihargakan pada 2.4 yuan China untuk input dan 24 yuan China untuk output. Strategi harga ini meletakkan M1 sebagai lebih kos efektif daripada DeepSeek R1 dalam dua peringkat pertama, sambil menawarkan keupayaan unik dalam peringkat tertinggi yang tidak dapat ditandingi oleh DeepSeek .

Perbandingan Harga (setiap juta token)

Panjang Konteks Harga Input (CNY) Harga Output (CNY)
0-32k 0.8 8
32k-128k 1.2 16
128k-1M 2.4 24

Nota: Dua peringkat pertama menawarkan prestasi harga yang lebih baik daripada DeepSeek R1; peringkat tertinggi tidak tersedia dalam DeepSeek

Ekosistem Produk Lebih Luas dan Cita-cita IPO

Pelancaran M1 hanya mewakili satu komponen daripada siri pengumuman produk lima hari menyeluruh MiniMax , yang turut merangkumi model penjanaan video Hailuo 02 dan platform MiniMax Agent . Pelancaran produk agresif ini berlaku ketika syarikat dilaporkan bersiap sedia untuk IPO Hong Kong yang berpotensi, berikutan langkah pesaing Zhipu AI yang lebih awal memfailkan penyenaraian awam. Pemerhati industri menyatakan bahawa MiniMax menghadapi cabaran besar dalam memenuhi keperluan hasil IPO , dengan pendapatan semasa bergantung terutamanya pada aplikasi lakonan watak Talkie yang berjaya dan platform video AI Hailuo yang lebih baharu.

Kedudukan Pasaran dan Pandangan Masa Depan

Kedudukan strategik MiniMax mencerminkan persaingan sengit antara syarikat permulaan AI China untuk mengekalkan relevan berikutan gangguan pasaran DeepSeek . Tumpuan syarikat pada keupayaan multimodal, terutamanya dalam penjanaan video di mana Hailuo AI telah mencapai kepimpinan global dalam kedudukan produk penjanaan video, menyediakan pendekatan berbeza berbanding pesaing yang hanya fokus pada teks. Walau bagaimanapun, kejayaan M1 dan produk berkaitan akhirnya akan menentukan sama ada MiniMax dapat mengekalkan kedudukannya antara syarikat AI China peringkat teratas sambil membina asas hasil yang diperlukan untuk kemasukan pasaran awam yang berjaya.