OpenAIは人工知能の分野で予想外の方向へ進みました。 打ち上げ de GPT-OSSは、同社にとって5年以上ぶりのオープンソース言語モデルです。この開発は、主に独自モデルとクローズドサービスに依存してきた同社の近年の戦略からの転換を示しています。GPT-OSSの登場により、OpenAIはその原点に立ち返り、クラウドプラットフォームやインターネット接続に依存することなく、誰でも、あるいは組織でも、強力な言語モデルにアクセスし、実行し、カスタマイズできるようになります。
新しいモデルには、120.000億のパラメータを持つバージョンと、20.000億のパラメータを持つ軽量バージョンのXNUMXつのバージョンがあります。最も強力なバージョンは、少なくとも80GBのメモリを搭載した単一のプロフェッショナルGPUで実行できますが、低性能バージョンは16GBのRAMを搭載した主流のPCやラップトップを対象としています。 高度なAI機能へのアクセスを大幅に民主化しますどちらのバージョンも、Hugging Face などのプラットフォームから無料でダウンロードでき、Azure や AWS などの一般的なサービスに展開できます。
技術的特徴と使用される技術
とともに GPT-OSSOpenAIは、以下のアーキテクチャに基づいて設計された2つのモデルを提示しました。 トランスフォーマーと専門家の混合(MoE)。 これにより メモリ使用量とレイテンシを最適化する 入力トークンごとに厳選されたエキスパートのみをアクティブ化することで、消費電力を犠牲にすることなく効率性を向上させます。120Bバージョンは36個のブロックを使用し、トークンごとに5.100億個のパラメータをアクティブ化します。一方、20Bバージョンは24個のブロックを使用し、3.600億個のパラメータをアクティブ化するため、より手頃な価格のハードウェアでも容易に実行できます。
どちらのモデルも、主に地域の英語データでトレーニングされています。 STEM、プログラミング、一般知識これには、あなたの能力を向上させるための監督下での調整と強化の追加段階が含まれます。 人間の指示との整合その機能の中には、 思考の連鎖、応答を提供する前に中間ステップを分解する機能、および Web ブラウジングや Python コード実行などの外部ツールを使用する機能。
可用性、ライセンス、統合オプション
GPT-OSSの大きな魅力の一つは、 Apache2.0ライセンスは、他の閉じたモデルによくある制約の多くを排除し、 商用利用、再配布、統合 小規模なスタートアップから大規模な公共機関、研究開発プロジェクトまで、あらゆるタイプのプロジェクトで利用可能です。モデルの重みはMXFP4形式で提供されており、PyTorchとApple Metalのリファレンス実装が用意されているほか、以下のようなツールとの完全な互換性があります。 Ollama、llama.cpp、LM Studio、vLLM職場環境と家庭環境の両方での使用を容易にします。
GPT-OSS-20Bのインストールと試運転は、LM Studioなどのユーティリティのおかげで非常に簡単です。 プログラミング経験のないユーザー モデルをダウンロードし、グラフィカルインターフェースを使用してローカルでテストできます。さらに、OpenAIはモデルの微調整と適応に関する詳細なドキュメントと推奨事項を公開しており、クラウドおよびオンプレミスプラットフォームへの統合も準備されています。
安全性、テスト、責任あるアプローチ
GPT-OSSの立ち上げはオープン性だけでなく、 安全と責任ある使用 モデルの。OpenAIは、特にサイバーセキュリティや悪意のあるエージェントの作成といった機密性の高い分野において、悪用に伴うリスクを回避するため、新たなレビューおよび検証メカニズムを導入しました。そのために、独立した専門家による外部レビューと、極端なエクスプロイトシナリオをシミュレートするためのプロトコルを備えた敵対的テスト手法(レッドチーム演習)を導入しました。
OpenAIはモデルの公開に合わせて、 賞金付きのレッドチームチャレンジ 脆弱性や問題行動を特定する人々にとって、リスク検出におけるグローバルコミュニティの積極的な協力を求めるものとなっています。さらに、GPT-OSSは、 推論の連鎖、バイアスや微妙なエラーを回避するために、応答の監査と監視を容易にします。
他のオープンモデルとのパフォーマンスと比較
で 学術ベンチマークと推論テストGPT-OSS-120Bは、o4-miniなどのOpenAIの最近の独自モデルと同等、あるいはいくつかの側面ではそれらを凌駕しており、特定の状況ではDeepSeek R1やLlamaシリーズなどの他のモデルよりも優れています。家庭用デバイス向けにカスタマイズされた20Bバージョンは、 効率と容量の優れた関係数学、コーディング、健康の課題で非常に競争力のあるスコアを獲得しました。
OpenAIは、これらのオープンモデルが 「幻覚」の傾向が強い (事実誤認)クラウドサービスと比較した場合、トレーニングとモニタリングの違いを考慮すると、(事実誤認)が発生する可能性はありますが、ユーザーはオンラインサービスを必要とせずに高レベルモデルを使用できるようになりました。