Pasukan Qwen daripada Alibaba telah mengeluarkan model AI terbaru mereka, Qwen3-30B-A3B-Instruct-2507 , menandakan pencapaian penting dalam menjadikan model bahasa yang berkuasa boleh diakses pada perkakasan pengguna. Keluaran ini mewakili model kelima daripada Qwen dalam tempoh hanya sembilan hari, mempamerkan kadar pembangunan AI yang tidak pernah berlaku sebelum ini dan telah menarik perhatian komuniti teknologi.
Model baharu ini membawa penambahbaikan yang ketara merentasi pelbagai bidang termasuk mengikuti arahan, penaakulan logik, matematik, pengkodan, dan penggunaan alat. Ia juga menampilkan keupayaan pemahaman konteks panjang yang dipertingkatkan sehingga 360,000 token, menjadikannya sesuai untuk memproses dokumen dan perbualan yang panjang.
Keluaran Model Qwen Terkini (Julai 2025):
- 21 Julai: Qwen3-235B-A22B-Instruct-2507
- 22 Julai: Qwen3-Coder-480B-A35B-Instruct
- 25 Julai: Qwen3-235B-A22B-Thinking-2507
- 29 Julai: Qwen3-30B-A3B-Instruct-2507
- 30 Julai: Qwen3-30B-A3B-Thinking-2507
Prestasi Setanding dengan GPT-4 Asal
Ujian awal oleh komuniti mencadangkan bahawa Qwen3-30B-A3B-Instruct-2507 memberikan tahap prestasi yang setanding dengan GPT-4 asal dari Mac 2023. Pencapaian ini amat ketara kerana model ini boleh berjalan dengan berkesan pada perkakasan pengguna dengan 32GB RAM apabila dikuantumkan, menjadikan keupayaan AI canggih boleh diakses oleh pembangun dan penyelidik individu.
Model ini menunjukkan kelajuan yang mengagumkan pada perkakasan pengguna kelas tinggi, mencapai lebih 100 token sesaat pada konteks yang lebih kecil dan mengekalkan lebih 20 token sesaat untuk konteks besar apabila berjalan pada MacBook M4 Max dengan 128GB RAM menggunakan kuantisasi 4-bit.
Keperluan Perkakasan:
- Minimum: 32GB RAM (versi terkuantisasi)
- Disyorkan: 48GB RAM untuk operasi yang selesa
- Prestasi optimum: M4 Max MacBook dengan 128GB RAM
- Prestasi: 100+ token/saat (konteks kecil), 20+ token/saat (konteks besar)
![]() |
|---|
| Perbandingan prestasi Qwen3-30B-A3B-Instruct-2507 dengan model AI terkemuka lain merentasi pelbagai penanda aras |
Meninggalkan Seni Bina Penaakulan Hibrid
Salah satu keputusan teknikal yang paling penting dalam keluaran ini ialah langkah Qwen untuk meninggalkan model penaakulan hibrid. Pasukan ini pada dasarnya telah membuktikan bahawa pendekatan penaakulan hibrid tidak berfungsi seefektif yang dijangkakan pada mulanya dan sebenarnya boleh memburukkan prestasi. Sebaliknya, mereka telah memberi tumpuan kepada mencipta model berasingan yang dioptimumkan sama ada untuk mengikuti arahan standard atau tugas penaakulan khusus.
Perubahan seni bina ini telah menghasilkan penambahbaikan prestasi yang ketara. Komuniti telah menyatakan bahawa pendekatan bukan hibrid memberikan hasil yang lebih baik sambil lebih cekap dari segi sumber pengiraan dan penjanaan respons.
Keupayaan Penggunaan Alat yang Kuat
Model ini cemerlang dalam penggunaan alat, meneruskan reputasi Qwen untuk membina sistem AI yang boleh berinteraksi dengan berkesan dengan alat dan API luaran. Keupayaan ini menjadikannya amat berharga untuk pembangun yang ingin membina aplikasi AI yang perlu mengakses pangkalan data, API, atau sumber luaran yang lain.
Semua model Qwen mahir menggunakan alat, termasuk yang berparameter 4B yang lebih kecil.
Gabungan keupayaan penggunaan alat yang kuat dengan keupayaan untuk berjalan secara tempatan menjadikan model ini menarik untuk aplikasi di mana privasi data dan operasi luar talian adalah pertimbangan penting.
Tetapan Konfigurasi yang Disyorkan:
- Temperature: 0.7
- TopP: 0.8
- TopK: 20
- MinP: 0
- Panjang output: 16,384 token
- Penalti kehadiran: 0-2 (untuk mengurangkan pengulangan)
Kadar Pembangunan Pesat Menimbulkan Perhatian
Jadual keluaran telah luar biasa, dengan lima model utama dikeluarkan dalam tempoh lebih sedikit daripada seminggu. Ini termasuk model yang berkisar dari 30B hingga 480B parameter, merangkumi kedua-dua mengikuti arahan umum dan tugas pengkodan khusus. Kadar yang pesat ini menunjukkan persaingan sengit dalam ruang AI dan komitmen Qwen untuk mengekalkan kepimpinan teknologi.
Model ini sudah tersedia melalui pelbagai saluran, termasuk Ollama untuk penggunaan tempatan yang mudah, menjadikannya boleh diakses oleh pembangun yang ingin bereksperimen dengan keupayaan AI canggih tanpa bergantung pada perkhidmatan awan.
Keluaran ini menunjukkan betapa cepatnya landskap AI berkembang, dengan model berkuasa yang dahulunya memerlukan sumber pengiraan yang besar kini tersedia untuk penggunaan tempatan pada perkakasan pengguna.
Rujukan: Qwen3-30B-A3B-Instruct-2507

