OpenAI Mengeluarkan Model Terbuka Pertama dalam Enam Tahun dengan GPT-OSS Yang Boleh Dijalankan Secara Tempatan

Pasukan Editorial BigGo

OpenAI Mengeluarkan Model Terbuka Pertama dalam Enam Tahun dengan GPT-OSS Yang Boleh Dijalankan Secara Tempatan

Selepas lebih daripada enam tahun memfokuskan secara eksklusif pada model proprietari, OpenAI telah membuat peralihan strategik yang ketara dengan mengeluarkan model bahasa terbuka pertamanya sejak GPT-2 . Model GPT-OSS yang baharu menandakan pemergian daripada pendekatan sumber tertutup syarikat baru-baru ini, menawarkan pembangun dan penyelidik keupayaan untuk memuat turun, menyesuaikan, dan menjalankan model AI canggih secara tempatan tanpa sambungan internet.

Dua Varian Model untuk Kes Penggunaan Berbeza

OpenAI telah memperkenalkan GPT-OSS dalam dua konfigurasi untuk menampung keperluan pengiraan yang berbeza-beza dan kes penggunaan. gpt-oss-120b yang lebih besar menampilkan 120 bilion parameter dan memberikan prestasi yang setanding dengan model proprietari o3 dan o4-mini OpenAI , memerlukan satu GPU Nvidia untuk operasi. gpt-oss-20b yang lebih kecil mengandungi 20 bilion parameter dan direka untuk kebolehcapaian yang lebih luas, berjalan dengan cekap pada peranti pengguna dengan hanya 16GB memori. Kedua-dua model menggabungkan keupayaan penaakulan rantaian pemikiran yang serupa dengan yang pertama kali diperkenalkan dalam model o1 OpenAI , membolehkan mereka menyelesaikan masalah kompleks langkah demi langkah dan bukannya memberikan output segera.

Perbandingan Spesifikasi Model

Model	Parameter	Keperluan Memori	Perbandingan Prestasi
gpt-oss-120b	120 bilion	GPU Nvidia tunggal	Serupa dengan model o3 dan o4-mini
gpt-oss-20b	20 bilion	Memori 16GB+	Serupa dengan model o3-mini

Keupayaan Menyeluruh Melangkaui Penjanaan Teks

Model GPT-OSS melangkaui penjanaan teks mudah, menawarkan suite keupayaan canggih yang meletakkannya sebagai alat AI yang serba boleh. Model teks sahaja ini boleh melayari web, melaksanakan kod, memanggil model berasaskan awan untuk bantuan dengan tugas khusus, dan beroperasi sebagai agen AI yang mampu menavigasi aplikasi perisian. Tidak seperti ChatGPT , yang memerlukan sambungan internet berterusan, model GPT-OSS boleh berfungsi sepenuhnya di luar talian dan di sebalik firewall korporat, menangani keperluan kritikal untuk organisasi dengan keperluan keselamatan data yang ketat.

Keupayaan Utama

Penaakulan rantaian pemikiran (serupa dengan model o1 )
Fungsi pelayaran web
Pelaksanaan kod
Integrasi model berasaskan awan
Navigasi perisian ejen AI
Keupayaan operasi luar talian
Penggunaan yang serasi dengan firewall

Respons Strategik kepada Persaingan Pasaran

Pengeluaran ini datang ketika OpenAI menghadapi persaingan yang semakin sengit dalam ruang model terbuka, terutamanya berikutan kejayaan model terbuka kos efektif startup China DeepSeek awal tahun ini. CEO Sam Altman mengakui bahawa OpenAI berada di sisi yang salah dalam sejarah mengenai pengeluaran model terbuka dan menekankan kepentingan memastikan inovasi dalam AI berat terbuka berlaku dalam Amerika Syarikat berdasarkan nilai demokratik. Pivot strategik ini juga meletakkan OpenAI untuk bersaing secara lebih langsung dengan siri Llama Meta , yang telah mendominasi landskap berat terbuka sejak 2023.

Ujian Keselamatan Ketat dan Penilaian Risiko

OpenAI telah melaksanakan apa yang digambarkannya sebagai protokol ujian keselamatan yang paling komprehensif setakat ini untuk model GPT-OSS . Syarikat menjalankan penilaian khusus untuk menilai senario penyalahgunaan berpotensi, termasuk penalaan halus model secara dalaman pada kawasan risiko untuk mengukur keupayaan berbahaya maksimum mereka. Penyelidik keselamatan Eric Wallace menjelaskan bahawa pasukan mendorong model ke had mereka dalam pelbagai kategori risiko, akhirnya menentukan bahawa mereka tidak mencapai tahap ancaman yang membimbangkan mengikut rangka kerja kesiapsiagaan OpenAI . Firma keselamatan luaran juga mengambil bahagian dalam proses penilaian, meneliti risiko berpotensi dalam keselamatan siber dan pembangunan senjata biologi.

Pelesenan Komersial dan Ketersediaan

Kedua-dua model GPT-OSS tersedia di bawah lesen Apache 2.0 , membolehkan penggunaan komersial, pengedaran semula, dan integrasi ke dalam projek perisian berlesen lain. Pilihan pelesenan ini sejajar dengan piawaian industri yang digunakan oleh model berat terbuka utama lain daripada syarikat seperti Qwen Alibaba dan Mistral . Model boleh dimuat turun serta-merta dari pelbagai platform termasuk Hugging Face , Databricks , Microsoft Azure , dan Amazon Web Services , menyediakan pembangun dengan pelbagai titik akses dan pilihan penggunaan.

Pelesenan dan Ketersediaan

Lesen: Apache 2.0

Penggunaan komersial dibenarkan
Pengedaran semula dibenarkan
Integrasi dengan perisian berlesen lain

Platform Muat Turun:

Hugging Face
Databricks
Microsoft Azure
Amazon Web Services

Penanda Aras Prestasi dan Kelebihan Kos

Menurut penyelidik OpenAI , model GPT-OSS menunjukkan skor penanda aras yang agak kukuh merentasi pelbagai metrik penilaian. Versi 120 bilion parameter berprestasi serupa dengan model proprietari o3 dan o4-mini OpenAI dan bahkan mengatasi mereka dalam penilaian khusus tertentu. Melangkaui prestasi mentah, OpenAI menekankan kelebihan model dalam latensi dan kos operasi, terutamanya untuk organisasi yang perlu memproses jumlah data yang besar atau mengekalkan operasi AI berterusan tanpa yuran API berulang.

Implikasi Masa Depan untuk Strategi OpenAI

Walaupun OpenAI tidak komited kepada jadual pengeluaran tetap untuk versi GPT-OSS masa depan, syarikat melihat model ini sebagai pelengkap dan bukannya bersaing dengan perkhidmatan berbayarnya. Pengasas bersama Greg Brockman menyifatkan model berat terbuka sebagai mempunyai set kekuatan yang sangat berbeza berbanding dengan penawaran proprietari, mencadangkan bahawa OpenAI merancang untuk mengekalkan pendekatan dwi yang melayani kedua-dua pembangun sumber terbuka dan pelanggan perusahaan yang memerlukan penyelesaian yang dihoskan. Strategi ini mencerminkan pengiktirafan syarikat bahawa menurunkan halangan kepada akses AI memacu inovasi dan membolehkan aplikasi tidak dijangka yang memberi manfaat kepada ekosistem teknologi yang lebih luas.