DeepSeek-V3.1はFP8とThinkモードを搭載した中国製チップを調査

  • Web とアプリ間で切り替え可能な、Think モードと Non-Think モードを備えたハイブリッド推論。
  • UE8M0 FP8は、次世代の中国国産チップをターゲットにしています。
  • 拡張されたコンテキスト ウィンドウ (ソースによると最大 128K) と API アクセス。
  • 輸出規制環境における NVIDIA への潜在的な影響。6 月 XNUMX 日より価格調整が実施されます。

DeepSeek-V3.1 モデル

DeepSeekはかつて、少ないリソースで多くのことを実現できることを示しました。そして今、それが再び ディープシーク-V3.1 そして明確なシグナル:モデルは 中国のチップスの次のバッチこれは市場の即時反転を意味するものではないが、一部の人々を不安にさせる可能性のある方向性を示している。 NVIDIA および同分野の他の関係者。

同社は、 ハイブリッド推論 2つのルートがあります: 考える (深い推論)と 考えない (クイックレスポンス)はウェブサイトとアプリから切り替えることができます。メッセージによると、バージョンは 考える 前回と比べてタイムが向上しており、重量が変わっただけでなく、 実行モード すでに稼働しているもの。

単一のアーキテクチャに対する2つの推論パス

DeepSeek-V3.1提案は、 二重ルート 最新世代のモデルでテストされているものを彷彿とさせる: 深い考え より複雑なタスクにはより機敏な動作を、そして即時の応答にはより機敏な動作を、それぞれに適応させます。インターフェースには、必要に応じて動作を切り替えるための「深く考える」ボタンが追加されました。

この切り替え 各クエリのコストとレイテンシを調整できます推論の質と速度の実用的なバランスを実現。ユーザーにとっては、会話の延長と、より効率的な管理につながります。 異種タスク 同じ流れで。

国産チップ向けUE8M0 FP8

DeepSeekは公式WeChatチャンネルに投稿したコメントで次のように述べています。 UE8M0 FP8 次世代の国産チップ向けです読み取ると明らかです。V8で採用されたFP3.1データフォーマットは 地域の生態系に合わせて調整Hugging Faceのデータシートには、このモデルが UE8M0 FP8スケールフォーマットこれは、精度が単なる重量配分の問題ではなく、トレーニングと実行設計の一部であることを示しています。

FP8は8ビットで動作するため、FP16/BF16と比較してサイズが半分になり、ネイティブサポートされていればサイクルあたりのパフォーマンスが向上し、メモリ消費量も削減されます。すべては中国市場に投入されるチップ次第です。 ネイティブに活用する そのスケーリングスキーム。もしこの連携が維持されれば、中国におけるAIの推進役を誰が担うのかという議論に一部変化が生じる可能性がある。

DeepSeek-V3.1 テクノロジー

DeepSeek-V3.1 のパフォーマンス、コンテキスト、可用性

DeepSeekは、 より広いコンテキストウィンドウ 伝えられた情報によれば、 128.000トークンに達する長い文書や複数ターンの会話向けに設計されています。このモデルはAPI経由で利用可能で、同社はHugging Face上でUE8M0 FP8の使用方法を詳しく説明した技術リソースを公開しています。

MathArena(ETHチューリッヒにリンクされたプラットフォーム)などの外部評価では、V3.1は そのThinkモードはトップモデルに登場、と GPT-5 最新のランキングで首位を獲得。スナップショットの数値以上に重要なのは、今回のアップデートによってこのモデルが競争力の頂点に位置づけられ、継続的な改善が可能になったことです。

サードパーティのテストではコーディングとロジックのタスクで肯定的な数値が報告されていますが、ハイエンドのライバル製品に対する正確なランキングはモデルによって異なります。 ベンチマーク同社は同時に、速度と推論をアーキテクチャと推論モードと組み合わせることにも重点を置いています。

競争の緊張と輸出規制

V3.1の動きは微妙な状況で起こっている。米国は 輸出規制 先進的なチップを中国に輸出しており、現地市場では自社の代替品への取り組みが加速している。NVIDIAは、最新の会計年度によれば、 収入の13%が中国へただし、FP8 をサポートする国内ソリューションへの移行の可能性により、時間の経過とともに需要が減少する可能性があります。

チップの状態 H20 中国では、許可、規制圧力、そして救済策の間で状況が変動しています。このような状況下では、中国の開発業者がこれらの規制の窓口にあまり依存せずに済むようなあらゆる手段が普及しつつあります。 戦略的価値したがって、地元の半導体における「次の一手」として設計された FP8 に関心が集まっています。

我々は地に足をつけておく必要がある。フィナンシャル・タイムズによると、DeepSeekは 技術的な問題 R2モデルをトレーニングする場合 Huawei社アセンド トレーニングにはNVIDIA GPUに戻らなければならず、 推論 実行可能な場合は中国製ハードウェアで動作します。最も理にかなった解釈は、V3.1を 反復 その方向では、決定的な飛躍ではありません。

DeepSeek-V3.1 の価格とロードマップ

ディープシーク アドバンス その 9月6 調整します API料金は、モデルをサードパーティ製品に統合できるチャネルです。詳細は公表されていませんが、このメッセージは、 持続可能性 V3.1 の導入後のサービス拡張。

同社は、このバージョンをアップデートスケジュールとリンクさせ、 R1 5月にシリーズの最初の進化 V3 3月に。技術的には、エコシステムソースは典型的なアーキテクチャを説明しています 専門家の混合 数百億のパラメータを持つ トークンあたりの資産品質を犠牲にすることなくリソースを最適化することを目的としています。

V3.1は明確なメッセージを残しました。 ハイブリッド推論訓練され、調整された UE8M0 FP8との互換性をテストする 中国製チップの次の波 さらに、APIを介したコンテキストと可用性の向上も実現しています。ハードウェアがこれをサポートし、ネイティブFP8が実現すれば、中国におけるAIの動向に関する議論の焦点は変わり、世界的な競争とサプライチェーンに波及効果をもたらす可能性があります。