Selepas lebih daripada enam tahun memfokuskan secara eksklusif pada model proprietari, OpenAI telah membuat peralihan strategik yang ketara dengan mengeluarkan model bahasa terbuka pertamanya sejak GPT-2 . Model GPT-OSS yang baharu menandakan pemergian daripada pendekatan sumber tertutup syarikat baru-baru ini, menawarkan pembangun dan penyelidik keupayaan untuk memuat turun, menyesuaikan, dan menjalankan model AI canggih secara tempatan tanpa sambungan internet.
Dua Varian Model untuk Kes Penggunaan Berbeza
OpenAI telah memperkenalkan GPT-OSS dalam dua konfigurasi untuk menampung keperluan pengiraan yang berbeza-beza dan kes penggunaan. gpt-oss-120b yang lebih besar menampilkan 120 bilion parameter dan memberikan prestasi yang setanding dengan model proprietari o3 dan o4-mini OpenAI , memerlukan satu GPU Nvidia untuk operasi. gpt-oss-20b yang lebih kecil mengandungi 20 bilion parameter dan direka untuk kebolehcapaian yang lebih luas, berjalan dengan cekap pada peranti pengguna dengan hanya 16GB memori. Kedua-dua model menggabungkan keupayaan penaakulan rantaian pemikiran yang serupa dengan yang pertama kali diperkenalkan dalam model o1 OpenAI , membolehkan mereka menyelesaikan masalah kompleks langkah demi langkah dan bukannya memberikan output segera.
Perbandingan Spesifikasi Model
Model | Parameter | Keperluan Memori | Perbandingan Prestasi |
---|---|---|---|
gpt-oss-120b | 120 bilion | GPU Nvidia tunggal | Serupa dengan model o3 dan o4-mini |
gpt-oss-20b | 20 bilion | Memori 16GB+ | Serupa dengan model o3-mini |
Keupayaan Menyeluruh Melangkaui Penjanaan Teks
Model GPT-OSS melangkaui penjanaan teks mudah, menawarkan suite keupayaan canggih yang meletakkannya sebagai alat AI yang serba boleh. Model teks sahaja ini boleh melayari web, melaksanakan kod, memanggil model berasaskan awan untuk bantuan dengan tugas khusus, dan beroperasi sebagai agen AI yang mampu menavigasi aplikasi perisian. Tidak seperti ChatGPT , yang memerlukan sambungan internet berterusan, model GPT-OSS boleh berfungsi sepenuhnya di luar talian dan di sebalik firewall korporat, menangani keperluan kritikal untuk organisasi dengan keperluan keselamatan data yang ketat.
Keupayaan Utama
- Penaakulan rantaian pemikiran (serupa dengan model o1 )
- Fungsi pelayaran web
- Pelaksanaan kod
- Integrasi model berasaskan awan
- Navigasi perisian ejen AI
- Keupayaan operasi luar talian
- Penggunaan yang serasi dengan firewall
Respons Strategik kepada Persaingan Pasaran
Pengeluaran ini datang ketika OpenAI menghadapi persaingan yang semakin sengit dalam ruang model terbuka, terutamanya berikutan kejayaan model terbuka kos efektif startup China DeepSeek awal tahun ini. CEO Sam Altman mengakui bahawa OpenAI berada di sisi yang salah dalam sejarah mengenai pengeluaran model terbuka dan menekankan kepentingan memastikan inovasi dalam AI berat terbuka berlaku dalam Amerika Syarikat berdasarkan nilai demokratik. Pivot strategik ini juga meletakkan OpenAI untuk bersaing secara lebih langsung dengan siri Llama Meta , yang telah mendominasi landskap berat terbuka sejak 2023.
Ujian Keselamatan Ketat dan Penilaian Risiko
OpenAI telah melaksanakan apa yang digambarkannya sebagai protokol ujian keselamatan yang paling komprehensif setakat ini untuk model GPT-OSS . Syarikat menjalankan penilaian khusus untuk menilai senario penyalahgunaan berpotensi, termasuk penalaan halus model secara dalaman pada kawasan risiko untuk mengukur keupayaan berbahaya maksimum mereka. Penyelidik keselamatan Eric Wallace menjelaskan bahawa pasukan mendorong model ke had mereka dalam pelbagai kategori risiko, akhirnya menentukan bahawa mereka tidak mencapai tahap ancaman yang membimbangkan mengikut rangka kerja kesiapsiagaan OpenAI . Firma keselamatan luaran juga mengambil bahagian dalam proses penilaian, meneliti risiko berpotensi dalam keselamatan siber dan pembangunan senjata biologi.
Pelesenan Komersial dan Ketersediaan
Kedua-dua model GPT-OSS tersedia di bawah lesen Apache 2.0 , membolehkan penggunaan komersial, pengedaran semula, dan integrasi ke dalam projek perisian berlesen lain. Pilihan pelesenan ini sejajar dengan piawaian industri yang digunakan oleh model berat terbuka utama lain daripada syarikat seperti Qwen Alibaba dan Mistral . Model boleh dimuat turun serta-merta dari pelbagai platform termasuk Hugging Face , Databricks , Microsoft Azure , dan Amazon Web Services , menyediakan pembangun dengan pelbagai titik akses dan pilihan penggunaan.
Pelesenan dan Ketersediaan
Lesen: Apache 2.0
- Penggunaan komersial dibenarkan
- Pengedaran semula dibenarkan
- Integrasi dengan perisian berlesen lain
Platform Muat Turun:
- Hugging Face
- Databricks
- Microsoft Azure
- Amazon Web Services
Penanda Aras Prestasi dan Kelebihan Kos
Menurut penyelidik OpenAI , model GPT-OSS menunjukkan skor penanda aras yang agak kukuh merentasi pelbagai metrik penilaian. Versi 120 bilion parameter berprestasi serupa dengan model proprietari o3 dan o4-mini OpenAI dan bahkan mengatasi mereka dalam penilaian khusus tertentu. Melangkaui prestasi mentah, OpenAI menekankan kelebihan model dalam latensi dan kos operasi, terutamanya untuk organisasi yang perlu memproses jumlah data yang besar atau mengekalkan operasi AI berterusan tanpa yuran API berulang.
Implikasi Masa Depan untuk Strategi OpenAI
Walaupun OpenAI tidak komited kepada jadual pengeluaran tetap untuk versi GPT-OSS masa depan, syarikat melihat model ini sebagai pelengkap dan bukannya bersaing dengan perkhidmatan berbayarnya. Pengasas bersama Greg Brockman menyifatkan model berat terbuka sebagai mempunyai set kekuatan yang sangat berbeza berbanding dengan penawaran proprietari, mencadangkan bahawa OpenAI merancang untuk mengekalkan pendekatan dwi yang melayani kedua-dua pembangun sumber terbuka dan pelanggan perusahaan yang memerlukan penyelesaian yang dihoskan. Strategi ini mencerminkan pengiktirafan syarikat bahawa menurunkan halangan kepada akses AI memacu inovasi dan membolehkan aplikasi tidak dijangka yang memberi manfaat kepada ekosistem teknologi yang lebih luas.