DeepSeek-V3.2: GPT-5やGemini-3 Proに対抗する中国モデル

  • DeepSeek は、高度な推論において GPT-5 および Gemini-3 Pro と競合するという野心を抱き、DeepSeek-V3.2 および V3.2-Speciale をリリースしました。
  • このモデルは、「思考」モードを外部ツールの使用に直接統合し、最大 128.000 トークンのコンテキストをサポートします。
  • V3.2-Speciale は数学とコンピュータサイエンスに優れており、国際オリンピックで金メダルレベルの成績を収めています。
  • 同社は重み付けと技術レポートを公開し、オープン AI におけるリーダーシップをめぐる中国、欧州、米国の争いを激化させています。

ディープシーク-V3.2

中国企業のDeepSeekが人工知能の世界的な競争に新たな動きを見せた。 発表するとき DeepSeek-V3.2 とそのバリアント V3.2-Specialeこれら2つのオープンソースモデルは、ハイエンド市場をターゲットとしています。同社は、自社の推論システムがGPT-5やGemini-3 Proといった主要ベンチマークに匹敵すると主張しており、熾烈な技術競争の時代にアメリカの巨大企業にプレッシャーをかけています。

ヨーロッパでは、 責任あるAI、規制、そして技術主権 こうした傾向はもはや当たり前のことであり、DeepSeekの動きも注目を集めています。中国の研究室が重み、詳細な技術文書、そして高度な推論モデルをオープンソースで公開したという事実は、オープンソース・エコシステムが完全なプロプライエタリ・ソリューションに対して力を取り戻しつつあるという印象を強めており、これは特にヨーロッパの大学、研究センター、そしてテクノロジー系中小企業にとって興味深いものとなるでしょう。

DeepSeek-V3.2: 主要モデルレベルでの推論

杭州を拠点とするスタートアップは、 ディープシーク-V3.2 数週間前にリリースされた実験版に代わる、同社の推論モデルの最終版かつ安定版となる。同社によれば、 V3.2はGPT-5と同等のパフォーマンスを実現 様々な中 ベンチマーク 多段階の推論と思考の聴衆であり、わずかに下に位置する ジェミニ 3.0 プロ いくつかのベンチマークテストでは。

このモデルは 外部ツールを使用できる人間型推論能力ウェブ検索エンジン、計算機、コード実行環境、あるいはClaude Codeのようなサードパーティシステムなどです。このシステムは、テキストを生成するだけでなく、計画、リソースのクエリ、関数の実行、そしてそれらの結果を統合して、常に監視を必要とせずに、より完全なレスポンスを生成することができるという考え方です。

DeepSeekは、このモデルが ツールとのインタラクションの2つのモード一つはユーザーが途中のステップを追うことができる視覚的な推論を備えたもの、もう一つは思考プロセスを表示しないもの。どちらの場合も、 ツールの導入が叫ばれる中でも「推論記憶」は健在 同じ会話内で実行され、ユーザーから新しいメッセージが届いた場合にのみ再開されます。これは、長いタスクやエージェント タイプのフローに特に役立ちます。

ツールの使用に統合された「思考」モード

DeepSeek-V3.2の最も印象的な新機能の一つは、 ツールの使用における思考モードの直接的な統合モデルは推論しながら、検索エンジンにクエリを送信したり、計算機を呼び出したり、コードを実行したり、他のサービスと対話したりして、内部分析と外部呼び出しのサイクルを組み合わせて回答を提供しようとします。 より詳細かつ正確 タスクに必要な場合。

同社によれば、このアプローチによりV3.2は 推論とツールをネイティブに使用できる最初のモデル標準モードと集中思考モードの両方で。これはいわゆる「集中モード」への明確なコミットメントです。 エージェントベースのワークフローこのような場合、AI は単に 1 つの質問に答えるのではなく、問題を分解し、情報を検索し、計算し、すべてを組み合わせて一貫したソリューションを導き出す自律エージェントとして機能します。

DeepSeek は、モデルが広く利用可能であることも強調しています。 DeepSeek-V3.2はWeb、アプリ、API経由で使用できます。これにより、ヨーロッパで開発されたプロジェクトを含む、製品、バーチャルアシスタント、ビジネスツールへの統合が容易になります。オープンな代替手段を求めるヨーロッパの開発者コミュニティや企業にとって、単一の主要プラットフォームに依存することなく、モデルを探求し、適応させることができることは大きな利点です。

DeepSeek Sparse Attention (DSA) アーキテクチャと計算効率

技術的なレベルでは、DeepSeek-V3.2の中核は DeepSeek スパースアテンション(DSA)計算コストを削減しながら非常に長いシーケンスを処理するように設計されたアテンション メカニズムです。 DeepSeekはAI向けに最適化された並列ファイルシステムを発表した これは、効率性と展開における取り組みを補完するものである。このモデルは約 合計671.000億のパラメータしかし、各推論ステップでは、 トークンあたり37.000億のパラメータこれにより、リソースの消費量を増やすことなく容量を維持できます。

この分散アーキテクチャにより、 最大128.000トークンのコンテキストウィンドウ 実稼働環境において、このサイズは、膨大な文書の分析、学術研究、あるいは大量の法的・技術的情報のレビューといった、欧州機関にとって非常に重要な分野に特に役立ちます。同社が提供したデータによると、 DSAは推論コストを約半分に削減します 長いコンテキストでの以前の密集したアーキテクチャと比較します。

コンピューティング予算の制約に直面しているスペインやその他のEU諸国の組織にとって、これは 効率改善 これにより、米国の大手テクノロジー企業が使用する高価なインフラを必要とせずに、高度なモデルを試すことができるようになります。しかし、DeepSeekは競合他社と比べてまだ改善の余地があることを認めています。 トークン効率と世界知識の広さ大規模展開における 2 つの重要な領域です。

DeepSeek-V3.2 エージェント向け強化学習と合成データを用いた強化学習

アーキテクチャを超えて、DeepSeekは推論の飛躍の多くは 強化学習(RL)による大規模な事後トレーニング同社は、 総プレワークアウト計算の10% この段階でのみ、この分野では異例の割合で、モデルの能力を強化することを目指しています。 エラーを修正し、深く推論し、ツールを使用し、対話型の環境で行動する.

チームは 複雑な合成データエコシステム これには、 1.800のトレーニング環境 そしてその周り 85.000の高度な指示 エージェント固有のタスク。これらのタスクには、現実世界の検索、動的シミュレーション、コード実行、連鎖問題、そしてデータセット内のエラーを最小限に抑えるための自動生成・検証シナリオが含まれます。

このアプローチは、 ある程度の自律性を持って動作できるAIエージェント情報分析、意思決定、そして多段階のワークフローにおける行動。財務分析から高度な技術サポートまで、複雑なプロセスの自動化を検討している欧州企業にとって、これらの進歩は特に魅力的かもしれません。ただし、管理されたテスト環境以外でこれらのモデルがどのように機能するかはまだ分かりません。

DeepSeek-V3.2-Speciale: 数学、コンピュータサイエンス、そして拡張思考

ジェネラリストモデルに加えて、DeepSeekは DeepSeek-V3.2-スペシャル、向けの変種 高度な微積分、数学的証明、そして長期にわたる思考プロセス同社は、このバージョンは ジェミニ 3 プロ Google の複雑な推論タスクにおけるパフォーマンスは、国際コンテストで金メダルに近いものである。

具体的には、スペチアーレは 国際数学オリンピック(IMO)の金メダルに匹敵するレベル国際情報オリンピック(IOI)ICPCワールドファイナル 中国数学オリンピックにも参加しています。さらに、モデルから派生した機能を統合しています。 DeepSeek-Math-V2定理の証明と非常に困難な問題の解決に特化しており、科学技術研究用モデルの分野での地位を強化しています。

標準バージョンとは異なり、 DeepSeek-V3.2-Specialeは日常的なタスクには適していません ツールとの汎用的な統合にも適していません。同社は、このモデルは主に 研究と学術活動の消費量で、 トークン 優れているので、今のところ API経由でのみ提供されます 汎用アプリケーションを通じてではありません。

DeepSeek-V3.2の可用性、アメリカの巨人との絞りとコントラスト

DeepSeekは DeepSeek-V3.2の完全な重みと詳細な技術レポート これは、コードへのアクセスや最先端の​​モデルのサイズを制限するなど、米国の大手テクノロジー企業がますます厳しくなっている方針とは対照的である。 オープンソース 部分的には、Llama のいくつかのバージョンと同様に、オープニングには特定の条件とニュアンスが伴います。

ヨーロッパの文脈では、この程度の 透明性と開放性 これは、監査可能性、規制遵守、またはモデルを規制フレームワークに適応させる能力を必要とするプロジェクトにとって重要となる可能性があります。 欧州連合AI法大学、研究センター、行政機関は、閉じられた外部 API に完全に依存することなく、モデルをより詳細に研究したり、実験を再現したり、さらには一部を独自のニーズに合わせて調整したりすることができます。

同社は DeepSeek-V3.2は、Hugging FaceやModelScopeなどのプラットフォームでコミュニティに公開されています。一方、Specialeバリアントは、API経由でのアクセスに加えて、その機能の制限により、現在はプログラムインターフェース経由の利用に限定されています。 計算需要とトークンあたりのコストの増加この混合配布戦略は、研究用の堅牢なモデルを持ちたいという多くの欧州企業の関心と一致していますが、商業展開にはより慎重な計画が必要になる可能性があります。

世界のAI競争における中国の役割

DeepSeek-V3.2のリリースは、 中国はAIにおけるリーダーシップ強化を目指す 高度な半導体へのアクセス制限や高まる地政学的緊張にもかかわらず、DeepSeek は今年初め、そのパワー対コスト比で皆を驚かせたモデルで突如登場して以来、中国のエコシステムで最も話題になる企業の一つとなり、現在ではハイレベルなエージェントと推論機能でその力をさらに強化している。

ヨーロッパでは、どのようにバランスをとるかが議論の中心となっている。 イノベーション、データ保護、セキュリティこうした開発には、機会と課題の両方が伴う。一方では、中国製の高容量オープンモデルの存在により、欧州の研究所や企業が利用できるツールの範囲が広がる。他方では、 現地の規制との適合性国境を越えたデータの流れとその影響 中国のコンテンツ規制一部の専門家は、これがこれらのシステムの完全な国際展開の障害となる可能性があると考えている。

DeepSeekは、V3.1モデルが参加して以来、国内市場以外でも認知度を高めている。 自動投資実験 GPT-5やGemini 2.5 Proといったシステムと比較して、競争力のある結果を示しました。この戦略は、次のような他のモデルの発売によって補完されています。 ディープシークOCR視覚認識を通してテキストを圧縮し、より少ないリソースで処理することを目指し、同社のイメージを強化した。 効率性とオープンソース.

期待、制限、そして次のステップ

同社の主張にもかかわらず、DeepSeekは V3.2はまだ米国のバージョンより遅れている 一般的な世界知識、幅広い文化的文脈の理解、トークンの使用効率といった側面において、プロジェクトリーダー自身も認めている。 公開ベンチマークに基づく比較 これらは、特にオープンタスクやエンドユーザーの場合、必ずしも実稼働環境における実際のパフォーマンスを反映するものではありません。

もう一つ考慮すべき点は、 推論モードでのツールの統合 医療から金融、法務上の意思決定に至るまで、複雑な現実世界のユースケースにおいて、DSAはまだ徹底的に検証される必要があります。DSAによってもたらされる計算コストの削減は顕著ですが、タスクがより曖昧になったり、非常に具体的なコンテキストが求められる場合に、応答の品質が一貫して維持されなければ、その効果は薄れてしまう可能性があります。

DeepSeek-V3.2とそのSpecialeバリアントの登場により、高度な推論AIの分野に、世界的な野望を持つ新たなプレイヤーが加わり、 オープンモデル、統合ツール、そしてコストの抑制こうした発展により、研究、ビジネス、行政で利用できる選択肢の範囲が広がるとともに、AI の急速な進化を、要求の厳しい規制の枠組みや技術ブロック間のますます激化する競争にどのように適合させるかを再考する必要が生じています。

ディープシーク
関連記事
DeepSeek、ChatGPT には中国からの競合他社があり、それを超える可能性さえあります